OpenAI 和 Oracle 达成协议,将建造庞大的 Stargate 数据中心,整个项目将支持 200 万个 AI 芯片
(图片来源:Oracle)
在关于 Stargate 项目,该项目涉及与 OpenAI、Oracle 和 SoftBank 的合作 提出的一些担忧中,包括基础设施支持的细节不足。公司逐渐披露了它们的意图,周二,OpenAI 和 Oracle 宣布计划在美国建设额外的 4.5 吉瓦(GW)的 Stargate 数据中心基础设施,将 OpenAI 的总计划容量推至 5 GW。有趣的是,尽管 SoftBank 是 Stargate 项目的一部分,但它并未参与这次建设融资。
根据一月份宣布的计划,OpenAI、Oracle 和 Softbank 计划建造每个面积为 500,000 平方英尺(46,450 平方米)的 20 个数据中心。然而,他们打算如何为数据中心供电尚不明确,因为美国的基础设施似乎没有足够的备用容量来为 AI 服务器、冷却系统和网络设备提供电力,除非再建造一些额外的设施。
宣布的 4.5 吉瓦的基础设施确实主要指的是电力供应能力,这是目前限制 AI 发展的主要因素之一。
OpenAI 声称其 5 吉瓦的扩展基础设施将使其数据中心能够支持超过 200 万个 AI 处理器,但并未透露该基础设施是用于支持 1.4 千瓦的 Blackwell Ultra 处理器还是 3.6 千瓦的 Rubin Ultra 处理器。如果 5 吉瓦的基础设施仅用于支持 AI 显卡,那么它将能够支持 357.1 万个 Blackwell Ultra 显卡或 138.8 万个 Rubin Ultra 显卡。然而,AI 加速器通常只消耗整个数据中心功率的一半,且未考虑电源使用效率(PUE),因此实际支持的显卡数量可能会更低。
新建 4.5 吉瓦容量的设施可能位于德克萨斯州、密歇根州、威斯康星州和怀俄明州,尽管确切位置仍在确定中。这除了德克萨斯州阿比林正在建设的现有设施外,该设施被视为 OpenAI 的验证概念设施,以确保其大规模和快速部署基础设施的能力。OpenAI 认为从阿比林学到的经验将有助于后续设施的实施。
阿比林设施的部分区域——Stargate I——现已开始运作,因为 Oracle 上个月开始安装基于 Nvidia GB200 平台的机架。OpenAI 已开始利用该基础设施进行早期阶段的 AI 训练和推理任务,作为其下一代研究计划的一部分。
评论