传谷歌与 Meta 达成新的数十亿美元级 AI 芯片合作协议
据《信息报》今日报道,Meta 平台公司已敲定一项数十亿美元的合作协议,将租用谷歌云的定制人工智能芯片。
该报道援引匿名消息人士的说法称,这款张量处理单元(TPU)芯片将由 Meta 用于其下一代大语言模型的训练与运行。
Meta 这类大型企业正斥资数十亿美元采购先进处理器,争相搭建支撑人工智能工作负载所需的基础设施,而谷歌也将此视为重要的业务增长机遇。当前,人工智能芯片市场由英伟达公司的图形处理器(GPU)占据主导地位,全球绝大多数人工智能应用均由其提供算力支持,而谷歌的 TPU 则成为兼具性价比的优质替代选择。
近年来,TPU 已成为谷歌云基础设施平台最重要的增长引擎之一,谷歌也认为这是提升自身市场份额的绝佳契机。去年 11 月,谷歌推出了其最先进的 Ironwood 系列 TPU,客户可将多达 9216 颗该款 TPU 整合为一个服务器机柜,通过高速互连技术实现最高 9.6 太比特 / 秒的带宽,还可接入高达 1.77 拍字节的共享高带宽内存(HBM)。
据谷歌介绍,Ironwood 系列 TPU 的 FP8 精度百亿亿次浮点运算性能,是最接近的竞争对手的 118 倍以上,在模型训练和推理方面的性能,较其上一代 Trillium 系列 TPU 提升了四倍。
Anthropic 公司是首批采用该款新型 TPU 的企业之一,该公司盛赞其实现了极致的性价比提升,助力自身大规模部署 Claude 大模型。此前,谷歌曾宣布与 Anthropic 达成一份价值 “数百亿美元” 的合作协议,将通过谷歌云基础设施平台为其开放 100 万颗 TPU 的算力访问权限。
对于正寻求摆脱对英伟达 AI 硬件依赖的 Meta 而言,此次与谷歌的合作意义重大。这家社交媒体巨头是英伟达的核心大客户之一,本月初还曾宣布达成一项数十亿美元的协议,将在英伟达新一代 Vera Rubin 系列 GPU 今年晚些时候上市后,采购数百万颗该款芯片。
但 Meta 并不希望受制于单一芯片供应商,还与英伟达的主要竞争对手超威半导体(AMD)建立了合作关系。本周早些时候,这家 Facebook 母公司宣布将采购价值数十亿美元的 AMD 人工智能芯片,包括其最新的 Instinct MI400 系列 GPU。此外,Meta 还获得了认购 AMD 10% 股权的选择权,不过该权利的生效,需以双方合作达到约定的性能里程碑为前提。
此次与谷歌的合作,让 Meta 的 AI 硬件供应商体系进一步多元化,而 Meta 此举也有着充分的考量。不同类型的人工智能处理器各有优劣,这家社交媒体巨头可据此为不同的 AI 工作负载匹配最优的芯片方案。此外,通过促成芯片厂商间的竞争,Meta 在搭建 AI 基础设施的过程中,有望获得更优惠的采购价格。
与此同时,谷歌也立志打破英伟达在 AI 芯片市场的垄断格局。谷歌深知,各大企业都希望获得英伟达 GPU 之外的替代选择,并决心抓住这一机遇。此前,谷歌的 TPU 仅能通过谷歌云平台提供服务,客户只能以租用的方式使用其算力。
而如今,谷歌计划直接向客户销售该款芯片,让客户可将其部署在自有私有数据中心中。谷歌认为,此举有望在未来几年内抢占英伟达数据中心业务 10% 的营收份额。
《信息报》的报道指出,Meta 目前正与谷歌洽谈,计划为其自有数据中心采购数百万颗 TPU,这将是一项独立于本次云算力合作的新协议。不过报道称,双方目前尚未就此达成一致。
本次合作对 Meta 自研芯片业务的影响,目前尚不明朗。Meta 上一次更新其定制化的 Meta 训练与推理加速器(MTIA)芯片是在 2024 年,有消息称该公司正与台积电合作研发新款芯片,原计划于今年推出。
据悉,这款新一代 MTIA 芯片针对 AI 模型训练进行了优化 —— 这也是其第一代处理器的短板所在。但有消息称,Meta 在新款芯片的研发过程中遭遇了 “技术难题”,芯片的推出时间或将因此推迟。




评论