新闻中心

EEPW首页 > 智能计算 > 编辑观点 > 传导致英伟达股价暴跌的DeepSeek拥有5万颗GPU

传导致英伟达股价暴跌的DeepSeek拥有5万颗GPU

—— 600 万美元只是总培训费用的一部分,DeepSeek 可能并不像声称的那样具有破坏性
作者: 时间:2025-02-10 来源: 收藏

初创公司 异军突起站在了大舞台的聚光灯下,根据披露的-V3 Mixture-of-Experts (MoE) 模型具有极为微小硬件要求(该公司声称 DeepSeek 的训练成本仅为 600 万美元和 2048 个 ),与现有美国的模型相比,对成本开销的要求要低得多,在性能上R1 AI模型据估计具有与Open AI的o1同等水平的竞争力,这引发了整个AI业界的地震,直接导致美国主要AI硬件企业总市值下跌近万亿美元,首当其冲的是下跌超过15%。

本文引用地址:https://www.eepw.com.cn/article/202502/466778.htm

虽然DeepSeek的横空出世重创了最近一两年因为AI高资本支出带来股价倍增的美国众多AI芯片公司,但随着放大镜下DeepSeek算力池浮出水面,AI对高基础设施支出的预期似乎有所回调。

行业分析公司 SemiAnalysis 报告称,DeepSeek 背后的公司可能承担了 16 亿美元的硬件成本,并拥有 50,000 个 Nvidia Hopper 算力阵列,这一发现削弱了 DeepSeek 以比 AI 行业现有领导者低得多的投资重塑 AI 训练和推理的想法。报告称,DeepSeek 运营着一个拥有大约 50,000 个 Hopper 的广泛计算基础设施。根据 SemiAnalysis 的数据,这包括 10,000块H800 和 10,000块H100,以及额外购买的 H20 设备。这些资源分布在多个位置,用于 AI 训练、研究和财务建模等目的。根据 SemiAnalysis 的数据,该公司在服务器方面的总资本投资约为 16 亿美元,估计用于运营成本的支出为 9.44 亿美元。

DeepSeek的走红迅速将自己曝光在全球科技媒体的聚光灯下,据公开资料显示,DeepSeek起源于中国对冲基金幻方High-Flyer,该公司很早就采用了 AI用于对投资市场的判断,并在 GPU 上投入了大量资金。2023 年,幻方推出了专注于 AI 的独立企业 DeepSeek,与许多竞争对手不同,DeepSeek保持自筹资金,使其在决策方面具有灵活性和速度。据 SemiAnalysis 称,尽管声称它是一个子公司,但幻方已在相关技术上投资了超过 5 亿美元。

对于大部分AI初创公司来说,没有雄厚的资本去构建自己的数据中心,因此几乎大部分动作都会被暴露在公众视野中。异军突起的DeepSeek与这些竞争者一个主要区别在于它能够运行自己的数据中心,相比于大多数其他依赖外部云提供商的AI初创公司,这种独立性允许完全控制实验和 AI 模型优化。此外,它支持快速迭代,没有外部瓶颈,与业内传统参与者相比,DeepSeek开发和训练的效率更高。

此外,SemiAnalysis还发现一个特别之处,相比于其他AI企业挖角美国或中国台湾的AI成熟专家,DeepSeek只从中国境内招聘(重点在北京大学和浙江大学),专注于技能和解决问题的能力,而不是曾经取得的证书和成就。根据调查,DeepSeek 的一些 AI 研究人员的收入超过 130 万美元,超过了Moonshot等其他领先的中国 AI 公司的薪酬。之所以SemiAnalysis关注人才结构,因为该公司经过调查发现,得益于人才流入DeepSeek 率先推出了多头潜在注意力 (MLA) 等创新,这需要数月的开发和大量 GPU 使用。DeepSeek 强调效率和算法改进,而不是暴力扩展,重塑了人们对 AI 模型开发的期望。出于多种原因,这种方法使一些人认为快速发展可能会减少对高端 GPU 的需求,从而影响等公司。

虽然DeepSeek 宣称只用了 600 万美元就训练了其最新模型,这个成本无异于给整个AI产业扔下了一枚“老男孩”。但是,这个数字应该仅是指该模型总训练成本的一部分,具体来说就是预训练所需的GPU 时间开销成本,应该没有考虑研究、模型优化、数据处理或整体基础设施费用。据估计,自成立以来DeepSeek在AI开发上花费了超过5亿美元,特别一点,SemiAnalysis 认为,与官僚主义背负重担的某些公司和受募资牵制不得不高调的某些公司相比,DeepSeek 的精益结构使其能够积极推进 AI 创新。DeepSeek 的成功建立在数十亿美元的战略投资、技术突破和有竞争力的员工队伍之上。这意味着没有奇迹,DeepSeeK的出现也并不是的末日。正如埃隆·马斯克 (Elon Musk) 一年左右前指出的那样,如果你想在 AI 领域保持竞争力,你必须每年花费数十亿美元,据报道,这正处于支出的范围内。

作为美国重要的战略产业,AI基础设施中的芯片一直是美国对中国管制的焦点。DeepSeek据称拥有英伟达5万颗GPU(大部分在2023美国发布的禁运令名单中),引发外界质疑其是否透过新加坡中介商取得美国出口管制的芯片。英伟达最新季报显示,新加坡约占其营收22%。 英伟达提交给监管机构的文件透露,与新加坡业务相关的大部分出货都运往新加坡以外的其他地区,运抵新加坡的数量极为稀少。加上之前新加坡的芯片公司被台积电拉黑,据传是为中国某企业代理下单7nm工艺AI芯片,新加坡未来将成为AI芯片管制一个新的热点。



关键词: 英伟达 DeepSeek GPU AI

评论


相关推荐

技术专区

关闭