新闻中心

EEPW首页 > 智能计算 > 编辑观点 > OpenAI装都不装了,提案要求禁用DeepSeek

OpenAI装都不装了,提案要求禁用DeepSeek

作者:陈玲丽 时间:2025-03-20 来源:电子产品世界 收藏

中国大模型公司杭州深度求索(DeepSeek)发布的开源模型DeepSeek-R1如同一股飓风,在市场掀起巨浪。DeepSeek之所以火爆科技圈,关键在于其只需要使用比-o1低90%至95%的API调用成本,就可以在数学、编程和推理等关键领域达到与-o1相媲美的表现。

本文引用地址:https://www.eepw.com.cn/article/202503/468386.htm

640.jpeg

彭博社这样描述DeepSeek-R1模型引起的轰动效应:“这一潜在威胁动摇了美国科技公司的行业领先地位,导致与相关的科技股大跌,包括微软、英伟达、甲骨文以及谷歌母公司Alphabet。”截至1月27日,这些公司的市值合计蒸发近1万亿美元。

DeepSeek打破刻板印象

2024年12月26日,DeepSeek-V3首个版本上线并同步开源,总参数达6710亿,采用创新的MoE(Mixture of Experts,混合专家)架构和FP8混合精度训练,公布了长达53页的训练和技术细节;2025年1月20日,新一代推理模型型DeepSeek-R1发布,部分性能与的GPT-4o正式版持平。近期,DeepSeek也发布了图像模型Janus pro,但是效果一般,在多模态的领域,开源还有更长的路要走。

DeepSeek-R1的开源及其后续的商业化部署,引起了全球用户和开发者的广泛关注,尤其是在资本市场上的影响力不容小觑。从技术路径来看,DeepSeek最大的优势在于,通过算法优化和资源调配,减少了大语言模型(LLM)预训练的时间。作为一个预训练模型,它在某些重要任务上的表现已经接近美国最先进的模型,同时显著降低了训练成本。

DeepSeek团队通过一系列令人印象深刻的创新实现了这一突破,主要集中在提升工程效率方面 —— 在「键值缓存」(Key-Value cache)管理方面做出了特别创新的改进,并且将MoE方法推进到了前所未有的水平。

在DeepSeek发表的原始报告中有详细解释这笔成本的计算:在预训练阶段,每兆个token上训练DeepSeek-V3仅需要180K H800 GPU小时,也就是说在拥有2048个H800 GPU的丛集上需要3.7天。因此,预训练阶段在不到两个月的时间内完成,耗费2664K GPU小时。加上上下文长度扩充所需的119K GPU小时和后制训练所需的5K GPU小时,DeepSeek-V3的完整训练仅需2.788M GPU小时。假设H800 GPU的租赁价格为每GPU小时2美元,总训练成本仅为557.6万美元。而GPT-4o的约为1亿美元,使用25000个GPU芯片。

推理成本上,OpenAI o1每百万输入和百万输出token分别收取15美元和60美元,而DeepSeek R1同样输入与输出的价格分别只要0.55美元和2.19美元,差不多只是前者的3%。

640-2.jpeg

不论是OpenAI还是其他头部AI厂商都走的是“大力出奇迹”路线,即通过堆大量来训练大模型推理能力,但DeepSeek用有限的资源走了一条适合国内的路。与其讨论DeepSeek能否成为“中国版”的OpenAI,不如说DeepSeek其实挑战了OpenAI的模式,毕竟OpenAI也并不一定是大模型的终局。

国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论:DeepSeek-V3超越了迄今为止所有开源模型。需要注意的是,对比Android与iOS的生态隔离,开源与闭源大模型均基于Transformer架构,差异是在数据、算法运用、工程等维度,并非是截然不同的技术路线。

DeepSeek不仅提升了国内AI技术的整体水平,还帮助开发者和中小型大模型创业公司完成了AI市场教育。目前,DeepSeek-R1、V3、Coder等系列模型已正式上线国家超算互联网平台,这标志着DeepSeek正式进入“国家队”,同时也代表着一个基于国产深算智能加速卡的普惠、可靠AI大模型时代的到来。

OpenAI提案要求禁用DeepSeek

OpenAI首席执行官Sam Altman在社交平台X上表示,“DeepSeek的R1是一款令人印象深刻的模型,尤其是考虑到它们能够以这个价格提供的功能”。OpenAI在DeepSeek-R1模型发布后,为了维持其在AI领域的领先地位,迅速发布了推理模型o3-mini,支持low、medium和high三种推理难度。另外,DeepSeek的崛起迫使OpenAI加速推出免费的搜索引擎功能以应对竞争,2025年2月6日,OpenAI宣布向所有用户开放ChatGPT搜索功能,并且无需注册即可使用。

而随后2025年3月13日,OpenAI全球事务副总裁Christopher Lehane向白宫科学技术政策办公室(OSTP)提交了一份长达15页的政策建议报告,DeepSeek在报告中被点名15次。Christopher Lehane表示”尽管美国目前在人工智能领域保持领先,但DeepSeek表明我们的领先优势并不大,而且正在缩小”,同时,声称在关键基础设施和其他高风险应用中使用DeepSeek会「带来重大风险」,要求美国政府采取行动。

640-3.jpeg

OpenAI指控DeepSeek存在技术安全缺陷,R1模型架构“可能导致敏感任务失控”,威胁美国关键基础设施。报告特别提及欧洲金融机构(如汇丰银行)测试DeepSeek模型,警示盟友技术依赖转移风险,呼吁加强「民主AI供应链」审查。

提案中,强调当前美国面临来自中国AI技术的“系统性挑战”,建议参考拜登政府的出口规则,采取分级制度:第一级(Tier I)是“致力于民主人工智能原则的国家”,包括美国盟友,完全遵循美国技术标准,可以享受补贴与市场准入,但不能使用中国生产的设备以及“侵犯用户隐私并存在知识产权盗窃等安全风险的人工智能模型”;第二级(Tier II)是没能阻止受出口管制的芯片被转移到“第三级国家”的国家,需承诺安全审查后可升级至Tier I;第三级(Tier III)则是中国等国家,严格限制AI技术出口。

OpenAI这封信函实际上是响应《人工智能行动计划》的一份提案,今年2月美国政府为制定新的AI政策向外界公开征求意见。今年1月,特朗普政府直接撤销了先前美国的AI行政命令《安全、可靠和值得信赖的人工智能开发与使用》,转而迅速签署了一项全新《人工智能行动计划》,要求在短短180天内提交一份AI行动计划,直言“美国矢志维持并巩固其在全球人工智能领域的霸主地位”。

美国国会、海军、五角大楼、NASA等政府机构和部门已经纷纷对DeepSeek下达了禁令,甚至在今年1月29日发布《2025年美国人工智能能力与中国脱钩法案》(Decoupling America’s Artificial Intelligence Capabilities from China Act of 2025)禁止美国人协助中国推动AI,并禁止美国人下载或使用DeepSeek,否则将被定性为犯罪,最高可判处20年监禁及处以100万美元的罚款。彭博报道,已有数百家美国公司,尤其是与政府相关的企业,都已经屏蔽了DeepSeek。

曾几何时,OpenAI堪称开源界的先锋,从GPT-3开始,画风突变,毅然筑起闭源的高墙,通过API订阅制赚得是盆满钵满,全然不顾曾经的开源初心。

OpenAI装都不装了

OpenAI提案中同时还呼吁美国联邦政府应该帮助AI公司免受日益严苛的州级AI法规的影响,借机提出了真正的核心议题 —— 联邦与州法规的博弈、版权数据使用的合法性争议。

想要获得州级法规豁免权

OpenAI建议建立一个范围明确的框架,促成联邦政府与私营公司之间的自愿合作,在适当的情况下政府能够从企业获得经验和资源,而作为交换,私营公司则能免受今年美国各州已经提出的781项与AI相关提案的影响。美国人工智能安全研究院(US AI Safety Institute)可以充当联邦政府与私营公司之间的主要政府机构,“企业不必受到各州法规的约束,因为后者显然远不及联邦层面的监管完善”。如果企业自愿与该机构合作,允许其对自家模型进行审查,政府就应该向它们提供“包括免除州级法规在内的责任保护”,尤其是在涉及前沿模型安全法规上。

OpenAI警告若美国不豁免AI公司州级法规束缚,否则在数据获取受限下,美国技术优势将迅速消失,中国将赢得AI竞赛。政府应鼓励公私合作,加速AI在政府机构中的应用,并消除已知的障碍,包括过时且冗长的认证流程、限制性测试权限、缺乏灵活性的采购渠道。

想要进行版权改革

已经有包括OpenAI在内的多家公司,因训练模型的数据而面临多起版权起诉。对于此前引起巨大争议的版权问题,OpenAI也强调应该对此进行版权改革 —— 这是因为「合理使用原则」(fair use doctrine)对维持AI领域的领先地位至关重要。

版权法在美国早期技术进步的阶段发挥了重要作用。美国拥有众多AI初创公司,吸引大量投资,并在研究方面取得诸多突破,主要也是得益于合理使用原则。OpenAI主张强化合理使用原则,允许被允许自由使用版权材料训练模型,同时推动国际版权规则改革,防止中国通过“宽松监管”获取数据优势。针对创作者群体的抗议,OpenAI反击称,欧盟的严格版权法已压制了AI创新。报告同时建议美国政府向企业开放医疗等敏感数据,以加速AI研发。

硅谷风险投资机构Andreessen Horowitz认为,联邦豁免权可释放企业创新潜力,避免“监管碎片化”拖累竞争。而MIT技术政策教授Daron Acemoglu批评OpenAI试图“用政治手段掩盖技术焦虑”,其出口管制将分裂全球科技共同体。

科技霸权or科技平权

其实,OpenAI早就盯上了DeepSeek。今年1月,OpenAI就曾公开指控DeepSeek通过「模型蒸馏」(Model Distillation)技术“违规复制”其产品功能,然而,OpenAI却拒绝透露具体技术细节或法律依据。模型蒸馏是一种通过训练小型模型模仿大型模型行为的技术,广泛应用于提高AI效率与降低成本,模型蒸馏本身是公开技术,但若涉及直接复制专有模型的输出结构或参数,可能构成侵权,但是模型输出的“功能相似性”难以直接构成侵权。

除非能证明DeepSeek直接窃取了OpenAI的训练数据或代码架构,否则诉讼可能无果而终,若指控属实,OpenAI应公开技术比对报告;若仅是战略打压,则可能损害行业创新生态。OpenAI与DeepSeek的争端,折射出全球AI产业从技术竞争向规则竞争演变的趋势。无论是模型蒸馏的法律定性,还是数据隐私的合规要求,都可能成为影响市场格局的关键变量。

640-4.jpeg

即便美国可以封杀掉DeepSeek的手机、网页端的应用,但DeepSeek的大模型、思路和代码都已经融入了全世界的人工智能社区,被包括美国在内的程序人员广泛使用。Meta首席科学家杨立昆(Yann LeCun)则直指,硅谷部分人拥有一种“错位的优越感”。OpenAI现在应该做的是调整自己的产品而不是攻击中国AI,进行毫无依据的污蔑和无理打压。

由于DeepSeek这次的开源,让行业最领先的水平平权了,寡头所谓的“AI霸权”开始动摇,AI竞赛的胜利者,不只能是拥有最多芯片的一方。这让OpenAI重新思考,需要“弄清楚另一种开源战略”,也是AI普惠的开端,会加速推动AI进化的速度,进而推动必要条件的成熟,带来新的应用机会。

DeepSeek以较低的成本开发出了一个性能接近美国模型水平的产品,这次的特殊之处在于,首先展示预期成本降低的是一家中国公司。这种情况前所未有,具有重要的地缘政治意义。需要注意的是,中国AI的崛起在基础层仍需突破芯片、算法等瓶颈的现状下,通过系统工程优化实现"换道超车"不仅可能,更是必然选择。

实际上,这是一场关于技术霸权争夺、地缘政治博弈与全球AI产业格局重塑的缩影。在DeepSeek之前,曾经AI技术被认为是高不可攀的“贵族科技”,只有少数巨头才能玩得起,OpenAI、微软、谷歌、Meta就像矗立在AI领域的高山。但这一次,DeepSeek把AI从垄断中解放出来,重构了全球AI竞争的逻辑:从依赖资本与硬件的“军备竞赛”,转向算法优化与生态协作的“效率革命”。

DeepSeek-V3极低的训练成本预示着AI大模型对算力投入的需求将大幅下降,但由经济学家威廉·斯坦利·杰文斯提出的杰文斯悖论:当某种资源的使用效率提高、获取变得更容易时,其总体使用量往往不减反增。DeepSeek的发展也呈现出类似的趋势:算力效率的提升并未减少对算力的需求,反而推动了更多高算力应用的落地,使得行业对算力的需求持续增长。

报告显示,2025年微软、亚马逊以及Meta等“超大规模企业”在人工智能数据中心和算力资源方面的投资将达到3710亿美元,较上年增长44%。这一数字将在2032年攀升至5250亿美元,增速超过DeepSeek这一现象级产品爆火之前的研究预期。

此前,人工智能方面的投资主要流向用于训练或开发大规模新AI模型的数据中心和芯片。如今,科技巨头将投资重点转向“推理”环节,也就是模型训练完成后运行并产出结果的过程。彭博行业研究分析师Mandeep Singh在报告中称,对DeepSeek的空前关注很可能会促使科技公司“追加投资推理环节”,使其成为生成式人工智能市场上增长最快的板块。



关键词: OpenAI Deepseek 算力 AI

评论


相关推荐

技术专区

关闭