在AI快速迭代浪潮中进行芯片设计

—— 长效智能体、工具调用大模型与多模态混乱正在重写边缘计算规则，也让芯片设计难度大幅提升。

作者：时间：2026-05-08 来源：

芯片架构师在设计高效 AI 处理器时，必须应对多重因素，其中最突出的就是快速迭代的 AI 模型。《半导体工程》邀请多位专家展开讨论，以下为访谈精华。

边缘端目前有哪些类型的智能体？

Steven Woo（Rambus）：当前边缘智能体主要分为感知、推理，机器人还会包含规划与执行。这些任务通常在同一设备上并发运行，关键不只是推理，而是系统观察、决策、响应的速度。这迫使设计师重新思考内存层级、互联与安全边界。智能体是整个系统协同工作，而不只是框图里的一个神经网络。

Sharad Chole（Expedera）：必须区分智能体 AI 与生成式 AI。最核心的差异是自主性。生成式 AI 是输入提示、给出回复；智能体 AI 在高层任务上具备更高自主性，接收高层指令后，自行负责编排、规划、执行。

它们还具备记忆能力与工具调用能力，不是被动响应提示，而是主动获取信息、调用 API / 工具，能查时间、天气、用户行为，甚至完成编译、测试等操作。

它们是 “会思考的机器”，会规划、闭环执行、迭代优化，通过工具获得反馈并调整计划。这是多轮交互，但不靠人工介入，而是通过工具完成。

这导致处理流程高度复杂，输入输出 Token 不固定，任务复杂度直接决定算力消耗。

Ronan Naughton（Arm）：私有智能体越来越普遍，本地部署的大模型可访问私人相册、日历，实现自动化任务，充当私人助理。

边缘设备上的编码智能体也在兴起，可并行执行多项任务，自主运行并反馈结果。

移动端还出现快速应用导航工具，一条指令即可自动打开多个 APP 完成操作。

模型必然持续迭代，架构师该如何启动项目并做决策？

Steven Woo（Rambus）：性能与功耗效率越来越由内存系统设计与数据搬运决定。架构师必须明确目标场景，果断砍掉非核心功能，每增加一个功能都会影响 PPA 并提升复杂度。

芯片设计要优先为数据流动而设计，这是决定成败的关键。同时还要融入合适的 RAS 方案，确保高可靠性、高可用性与可预测运行。

Steve Roddy（Quadric）：架构师必须尽可能提升通用性与灵活性，因为未来嵌入式智能体的形态、算力与通信需求都无法预知。

例如未来车载健康智能体，可预测保养、了解驾驶习惯、结合季节天气给出建议，并适配不同车主的使用场景。计算基础设施需要足够通用，才能支撑这类需求。

Jason Lawley（Cadence）：智能体最终指向多模态 AI。车载智能体不仅能监测状态，还能语音通话、预约维修、降噪、语音识别、调用语言模型，彻底改变人机交互方式。

架构师必须保证模型灵活性，支持不同浮点表示与多种模型类型。

Gordon Cooper（Synopsys）：多模态需求是核心挑战。NPU 需要灵活适配不断涌现的多模态模型（视觉 - 语言 - 动作 VLA、视觉 - 语言模型 VLM 等），这是边缘 NPU 设计的最大难点。

Sharad Chole（Expedera）：从部署角度看，智能体工作负载是长效后台运行，必须极致优化。

必须支持混合专家 MoE：边缘无批处理，MoE 至关重要。
支持KV 缓存量化：节省 2~3 倍带宽。
运行时需支持前缀缓存、工具调用。
本质是把数据中心级推理能力下沉到边缘，用最小资源实现最强智能体能力。
除隐私需求外，联网设备是否适合在边缘运行智能体，目前尚无定论。

目前边缘 AI / 边缘智能体 AI 最有趣的应用有哪些？

Steven Woo（Rambus）：最具价值的应用在实时性要求高的系统：工业自动化、机器人、汽车感知。

这些系统用智能体行为实时适配动态输入，而非简单分类。硬件挑战是在持续数据流下保持低延迟，这推动了内存带宽、功耗效率与系统级集成的创新。

Jason Lawley（Cadence）：应用无处不在，覆盖所有边缘场景，新场景还在不断涌现。

Steve Roddy（Quadric）：大模型 / 小模型正在彻底改变人机界面：汽车交互、工厂设备运维、厨房家电。

去掉微波炉物理按键，改用语音交互，可降低成本、减少故障点；工厂设备用麦克风 + 扬声器 + 显示屏，替代 600 页手册；汽车不再需要纸质故障手册，直接语音对话。

这些改变降低硬件成本、提升用户体验，边缘部署大模型使之成为可能。

Sathishkumar Balasubramanian（Siemens EDA）：个人健康助手快速兴起，不只感知，还能执行操作。

西门子与 Meta 合作 Ray-Ban 智能眼镜，用于工厂车间：工人走近设备，实时显示仪表盘状态（正常 / 异常 / 需维护）。

这是典型的边缘 AI + 人类协作。

笔记类设备的主要瓶颈则是供电，功能越多，功耗效率越关键。

Gordon Cooper（Synopsys）：感知式 AI 开始落地真实用例。汽车座舱内，用户指向窗外建筑即可询问名称，多模态能力可结合视觉、地理位置、指令理解。

物理 AI 与机器人（汽车、无人机、人形机器人）也是热点，英伟达积极布局，尽管家庭机器人尚未普及，但发展前景值得关注。

我们是否经历过像 AI 这样快的技术迭代速度？

Sathishkumar Balasubramanian（Siemens EDA）：从业 25 年，从未见过如此快的迭代。每周都有新客户、新项目、新应用，行业一直在追赶。

Jason Lawley（Cadence）：历史上 x86 兴起、仙童竞争的时代创新活跃，但 AI 的普及广度远超当年，全民都在关注。

Sharad Chole（Expedera）：机器人与自主系统将进一步突破极限，会出现PetaOPS 级算力引擎。世界模型需要在自主平台运行，对视觉与 Token 处理要求极高，这将是一年后的核心话题。

Steven Woo（Rambus）：AI 迭代速度是现代芯片设计史前所未有的。AI 压缩了全栈开发周期，硬件直接承受压力。新能力不断推出，需求持续改写，一年前的假设很快失效。

这迫使采用系统级整体设计：计算、内存、安全、I/O 从一开始就与软件需求协同规划，这是未来芯片设计思路的根本性转变。

Ronan Naughton（Arm）：迭代呈指数级。AI 不再是概念炒作，已带来真实的生产力、生活品质提升与创新发现，但伴随风险，必须平衡收益与潜在隐患。

新闻中心