在AI快速迭代浪潮中进行芯片设计
芯片架构师在设计高效 AI 处理器时,必须应对多重因素,其中最突出的就是快速迭代的 AI 模型。《半导体工程》邀请多位专家展开讨论,以下为访谈精华。
边缘端目前有哪些类型的智能体?
Steven Woo(Rambus):当前边缘智能体主要分为感知、推理,机器人还会包含规划与执行。这些任务通常在同一设备上并发运行,关键不只是推理,而是系统观察、决策、响应的速度。这迫使设计师重新思考内存层级、互联与安全边界。智能体是整个系统协同工作,而不只是框图里的一个神经网络。
Sharad Chole(Expedera):必须区分智能体 AI 与生成式 AI。最核心的差异是自主性。生成式 AI 是输入提示、给出回复;智能体 AI 在高层任务上具备更高自主性,接收高层指令后,自行负责编排、规划、执行。
它们还具备记忆能力与工具调用能力,不是被动响应提示,而是主动获取信息、调用 API / 工具,能查时间、天气、用户行为,甚至完成编译、测试等操作。
它们是 “会思考的机器”,会规划、闭环执行、迭代优化,通过工具获得反馈并调整计划。这是多轮交互,但不靠人工介入,而是通过工具完成。
这导致处理流程高度复杂,输入输出 Token 不固定,任务复杂度直接决定算力消耗。
Ronan Naughton(Arm):私有智能体越来越普遍,本地部署的大模型可访问私人相册、日历,实现自动化任务,充当私人助理。
边缘设备上的编码智能体也在兴起,可并行执行多项任务,自主运行并反馈结果。
移动端还出现快速应用导航工具,一条指令即可自动打开多个 APP 完成操作。
模型必然持续迭代,架构师该如何启动项目并做决策?
Steven Woo(Rambus):性能与功耗效率越来越由内存系统设计与数据搬运决定。架构师必须明确目标场景,果断砍掉非核心功能,每增加一个功能都会影响 PPA 并提升复杂度。
芯片设计要优先为数据流动而设计,这是决定成败的关键。同时还要融入合适的 RAS 方案,确保高可靠性、高可用性与可预测运行。
Steve Roddy(Quadric):架构师必须尽可能提升通用性与灵活性,因为未来嵌入式智能体的形态、算力与通信需求都无法预知。
例如未来车载健康智能体,可预测保养、了解驾驶习惯、结合季节天气给出建议,并适配不同车主的使用场景。计算基础设施需要足够通用,才能支撑这类需求。
Jason Lawley(Cadence):智能体最终指向多模态 AI。车载智能体不仅能监测状态,还能语音通话、预约维修、降噪、语音识别、调用语言模型,彻底改变人机交互方式。
架构师必须保证模型灵活性,支持不同浮点表示与多种模型类型。
Gordon Cooper(Synopsys):多模态需求是核心挑战。NPU 需要灵活适配不断涌现的多模态模型(视觉 - 语言 - 动作 VLA、视觉 - 语言模型 VLM 等),这是边缘 NPU 设计的最大难点。
Sharad Chole(Expedera):从部署角度看,智能体工作负载是长效后台运行,必须极致优化。
必须支持混合专家 MoE:边缘无批处理,MoE 至关重要。
支持KV 缓存量化:节省 2~3 倍带宽。
运行时需支持前缀缓存、工具调用。
本质是把数据中心级推理能力下沉到边缘,用最小资源实现最强智能体能力。
除隐私需求外,联网设备是否适合在边缘运行智能体,目前尚无定论。
目前边缘 AI / 边缘智能体 AI 最有趣的应用有哪些?
Steven Woo(Rambus):最具价值的应用在实时性要求高的系统:工业自动化、机器人、汽车感知。
这些系统用智能体行为实时适配动态输入,而非简单分类。硬件挑战是在持续数据流下保持低延迟,这推动了内存带宽、功耗效率与系统级集成的创新。
Jason Lawley(Cadence):应用无处不在,覆盖所有边缘场景,新场景还在不断涌现。
Steve Roddy(Quadric):大模型 / 小模型正在彻底改变人机界面:汽车交互、工厂设备运维、厨房家电。
去掉微波炉物理按键,改用语音交互,可降低成本、减少故障点;工厂设备用麦克风 + 扬声器 + 显示屏,替代 600 页手册;汽车不再需要纸质故障手册,直接语音对话。
这些改变降低硬件成本、提升用户体验,边缘部署大模型使之成为可能。
Sathishkumar Balasubramanian(Siemens EDA):个人健康助手快速兴起,不只感知,还能执行操作。
西门子与 Meta 合作 Ray-Ban 智能眼镜,用于工厂车间:工人走近设备,实时显示仪表盘状态(正常 / 异常 / 需维护)。
这是典型的边缘 AI + 人类协作。
笔记类设备的主要瓶颈则是供电,功能越多,功耗效率越关键。
Gordon Cooper(Synopsys):感知式 AI 开始落地真实用例。汽车座舱内,用户指向窗外建筑即可询问名称,多模态能力可结合视觉、地理位置、指令理解。
物理 AI 与机器人(汽车、无人机、人形机器人)也是热点,英伟达积极布局,尽管家庭机器人尚未普及,但发展前景值得关注。
我们是否经历过像 AI 这样快的技术迭代速度?
Sathishkumar Balasubramanian(Siemens EDA):从业 25 年,从未见过如此快的迭代。每周都有新客户、新项目、新应用,行业一直在追赶。
Jason Lawley(Cadence):历史上 x86 兴起、仙童竞争的时代创新活跃,但 AI 的普及广度远超当年,全民都在关注。
Sharad Chole(Expedera):机器人与自主系统将进一步突破极限,会出现PetaOPS 级算力引擎。世界模型需要在自主平台运行,对视觉与 Token 处理要求极高,这将是一年后的核心话题。
Steven Woo(Rambus):AI 迭代速度是现代芯片设计史前所未有的。AI 压缩了全栈开发周期,硬件直接承受压力。新能力不断推出,需求持续改写,一年前的假设很快失效。
这迫使采用系统级整体设计:计算、内存、安全、I/O 从一开始就与软件需求协同规划,这是未来芯片设计思路的根本性转变。
Ronan Naughton(Arm):迭代呈指数级。AI 不再是概念炒作,已带来真实的生产力、生活品质提升与创新发现,但伴随风险,必须平衡收益与潜在隐患。








评论