Arm以AGI CPU搅动AI处理器竞争格局
3月24日,Arm正式推出首款量产级自研 CPU 芯片,作为Arm成立35年来首款实体处理器,新产品命名为Arm AGI CPU,面向智能体 AI 基础设施场景打造。该芯片的研发核心在于计算子系统(CSS)的打造,这一系统为芯片核心提供了全套功能组件。
该芯片热设计功耗(TDP)为 300W,采用台积电 3nm 工艺制造双裸片架构,搭载 136 个 Neoverse V3 核心,主频最高 3.7GHz(基准主频 3.2GHz)。每个核心配备 2MB 二级缓存,另有 128MB 共享系统级缓存(SLC)。Arm 称,数据中心内的智能体驱动类应用,在同等功耗下所需的 CPU 算力或将达到当前每吉瓦算力的 4 倍以上,这需要 “一套架构更精简、无 x86 处理器冗余与复杂设计的方案”。

Arm AGI CPU 核心优势体现在如下几点。
性能:单 CPU 最高搭载 136 个 Arm Neoverse V3 核心,实现领先的单核心、片上系统、刀片服务器及机架级性能;单核心内存带宽达 6GB/s,延迟低于 100 纳秒。
扩展性:300W 热设计功耗,为每个程序线程配备专用核心,可在持续负载下保障稳定性能,避免性能降频与线程闲置。
能效:支持高密度 1U 服务器机箱,风冷部署单机架可搭载 8160 个核心,液冷系统单机架核心数量超 45000 个。
Arm 首席执行官Rene Haas表示:“今天标志着 Arm 计算平台迈入新阶段,也是公司发展的重要里程碑。我们凭借 Arm AGI CPU 拓展至量产芯片领域,为合作伙伴提供了更多选择。” Arm为AI处理器制定了详细的多年规划,计划于明年推出基于 Neoverse V4 核心(和新一代计算子系统的芯片产品,后续还将推出搭载 V5 计算子系统的版本,进一步覆盖整体潜在市场(TAM)。预计,自研独立芯片业务将推动公司年收入在五年内增长5倍,达到250亿美元;届时IP业务营收预计为100亿美元。
此番Arm推出实体芯片AGI CPU,瞄准了AI基础设施爆发式增长的契机。随着AI基础设施构建从大模型训练为主向模型训练和推理应用转变,Rene Haas介绍,AI运算正从传统“GPU主导”走向“CPU+GPU协同”的新架构,CPU负责调度、执行与数据流管理的角色急速扩大,智能体AI的快速普及,Arm看好未来数据中心CPU需求将呈现倍数成长。“据我们估算,人工智能数据中心中,每吉瓦算力对应的中央处理器核心数量约为 3000 万个。近几个月来,人工智能智能体的爆发式增长彻底改变了行业格局。” Haas说,“当算力需求转向智能体式查询时,数据处理的令牌量至少会提升 15 倍,数据中心的算力压力因此骤增,这意味着市场需要更多中央处理器。据我们测算,所需的核心数量将提升至原先的 4 倍 —— 即在相同算力下,需要 1.2 亿个中央处理器核心。我们试图在本就被各类加速器占满的数据中心功耗范围内,塞进 4 倍数量的核心,这无疑是一大技术难题。”
Arm直接投入芯片设计,外界担忧与现有生态系伙伴和自身客户形成竞争。这是其必须面对的核心问题,Haas也多次强调,公司已充分认识到这一点,此举是为满足市场需求扩大,而非取代既有客户,整体市场仍属高度成长的「未满足市场」。“这是一个体量极其庞大的市场,且目前的服务仍远未满足需求,我们认为市场足以容纳多家玩家共同发展。” Haas说,“目前已有 1 万家企业在云端采用 Arm 架构,而 AGI 中央处理器将为它们提供本地化部署的同类算力方案。”AGI CPU目前主要是针对客户定制开发的市场需求,Meta将是AGI CPU的第一个客户,OpenAI则可能成为第二个。

Arm CEO Rene Haas展示AGI CPU
此外,AI数据中心架构升级,也同步带动服务器品牌与系统厂需求。Arm这次介入CPU战局并不是只瞄准CPU的竞争,而是放眼未来AI服务器机架体系更大的市场。Arm透露,其芯片将透过ODM/OEM伙伴导入机架(rack)系统,并与整体数据中心架构整合,系统端价值同步提升。在更宏观的机架性能方面,相比最新x86系统,Arm AGI CPU可将单机架性能提升超2倍,每吉瓦AI数据中心算力可节省高达100亿美元 CAPEX。在相同功耗预算下,提供数倍于x86的可用核心数与线程数,显著提升加速器利用率。
该芯片搭载了 PCI Express 6.0 和 CXL 高速互连协议,支持打造散热设计功耗 600 瓦的双芯片服务器卡,单颗芯片的功耗可控制在 300 瓦以内。Arm 云 AI 事业部执行副总裁 Mohamed Award表示:“我们选择 PCIe 6.0,是因为这一版本的标准知识产权技术最为成熟。”Arm基于开放计算项目(OCP)标准,打造了一套风冷机柜原型:集成 30 张 1U 服务器卡,共计 8160 个计算核心,整体功耗为 36 千瓦。“我们正持续为开放计算项目贡献多项技术方案,这些方案不仅适用于 AGI 中央处理器,还将赋能整个生态系统。” Award还透露,Arm还可打造液冷机柜方案,集成 42 张服务器卡、1 Peta字节内存,整体功耗可达 200 千瓦,不过Arm本身并不会直接提供机柜和板卡硬件产品。













评论