GenAI的惊人速度正在重塑半导体行业
人类正在目睹一场如此极端的技术革命,其全部规模可能超出我们的智力范围。生成式 AI (GenAI) 的性能每六个月翻一番 [1],超过了业界所说的超级摩尔定律的摩尔定律。一些云 AI 芯片制造商预计未来十年每年的性能将翻倍或翻三倍 [2]。在这个由三部分组成的博客系列中,我们将探讨当今的半导体格局和创新芯片制造商战略,在第二部分深入探讨未来的重大挑战,并在第三部分通过研究推动 AI 未来的新兴变化和技术来结束。
按照这种爆炸性的速度,专家预测通用人工智能 (AGI) 将在 2030 年左右实现 [3][4],紧随其后的是人工智能超级智能 (ASI) [5]。AGI 将拥有类似人类的推理能力,而 ASI 将超越它,重新编程自己,即使是最专业的头脑也无法理解。AGI 通过自我修饰迅速演变为 ASI,俗称智能爆炸。
下图使这种指数加速度不容忽视。在短短几年内,AI 在许多曾经被认为需要深厚专业知识的复杂任务中超越了人类的表现。它还迅速接近其他领域,例如推理、数学问题解决和代码生成。几十年停滞不前的功能现在只需几个月即可实现飞跃。如果保持这种速度,AI 将很快在几乎所有认知领域都超过人类,将 AGI 从理论变为必然。
比较 AI 和人类在不同领域的能力。当 AI 的性能越过零线时,它的得分比人类高 [6]。
这种快速发展对半导体行业的影响是深远的,因为 GenAI 正在推动对支持训练和推理的高级云 SoC 的强劲需求。分析师预测,到 2030 年,这一专业领域将接近 3000 亿美元,复合年增长率接近 33% [7]。
这种激增的需求打破了关于半导体市场变化速度的旧假设,GenAI 的快速发展证明他们可以在一夜之间颠覆它。该图表显示,生成式 AI 在两年内达到了 PC 需要近十年才能达到的采用水平,甚至比智能手机、平板电脑 [8] 和互联网还要快。
生成式 AI 的采用率超过了早期的 PC 和互联网使用量,因为 39.4% 的 18-64 岁美国人报告在 ChatGPT(生成式预训练转换器)发布后的两年内使用它 [9],使其成为历史上增长最快的技术 [10]。
地缘政治进一步放大了这些市场震动。美中科技竞争已将半导体变成两个超级大国军备竞赛的战略资产。美国实施了广泛的出口限制,阻止中国获得美国的人工智能处理器,旨在减缓其实现 AGI 的进展 [11]。中国正在通过颠覆性举措进行反击,例如开源 DeepSeek-R1,由于美国的芯片限制,该芯片是使用早期芯片构建的。
实现产量最大化的多样化芯片制造商策略
下表汇编了几款领先的 AI 芯片的最新规格。所有数字均基于单芯片,而不是多芯片系统,例如 NVIDIA 的 GB200 NVL4。仅包含发布时可用的芯片。
这些数据提供了一个高层次的概述,而不是严格的同类比较,后者需要在相同的工作负载和条件下测试所有芯片。每瓦性能 (PPW) 是通过计算 (PFLOPS⋅1000)/瓦特 (PFLOPS·1000)/瓦特来推导出的,但一些芯片制造商并未公开披露瓦数(参见下面的 N/A)。
该表的构建主要依赖于官方供应商规范和信誉良好的第三方来源。在少数情况下,会推断值,例如根据 8 位浮点 (FP8) Peta 每秒浮点运算数 (PFLOPS) 估计 16 位浮点 (FP16) 性能。
市场上一些最受欢迎的云 AI 加速器的鸟瞰图。*片上 SRAM,与其他使用片外 HBM 的芯片不同。
像这样并排比较所有供应商,揭示了 AI 加速器设计中的不同策略:
NVIDIA 和 AMD 凭借基于 GPU 的架构和海量 HBM 内存带宽占据主导地位。
AWS、Google 和 Microsoft 依赖于针对其数据中心优化的定制芯片。
Cerebras 和 Groq 推动了新型架构,如晶圆级芯片和数据流执行。例如,Cerebras 从单个芯片提供 125 PFLOPS 和 21 PB/s 带宽。同时,Groq 强调超低延迟的数据流路径,以减少推理延迟。
生成式 AI 的加速发展不仅改变了技术,还重塑了半导体行业并加剧了地缘政治紧张局势。随着芯片制造商竞相提供前所未有的处理能力和效率,所部署的策略多种多样且具有创新性,但挑战却是深远的。这种快速进展伴随着重大障碍,尤其是对于基于云的 AI 部署,其中有效和可持续地扩展变得越来越复杂。
引用
萨兰,C.(2024 年)。Microsoft Ignite:AI 功能每六个月翻一番
黄 J. (2024)。NVIDIA 首席执行官黄仁勋预测 AI 将以“超级摩尔定律”的速度发展。巴伦周刊。
阿莫迪,D.(2024 年)。Anthropic Chief:到明年,AI 可能比所有人类都更聪明。泰晤士报。
库兹韦尔,R.(2024 年)。AI 领导者讨论该技术的变革潜力。时间。
戈策尔,B.(2024 年)。人工智能超级智能可能在 2027 年到来。未来主义。
Kiela, D., Thrush, T., Ethayarajh, K., & Singh, A. (2023)。在 AI 中绘制进度。情境化 AI 博客。
下一步战略咨询。(2025). 人工智能 (AI) 芯片市场报告。
内幕情报。(2023). 生成式 AI 的采用速度比智能手机和平板电脑攀升得更快。eMarketer 的
圣路易斯联邦储备银行。(2024). 生成式 AI 的快速采用。
福布斯。(2023). 突然人工智能:历史上采用最快的商业技术。
卡奇瓦拉,Z.(2025 年)。NVIDIA 面临美国 AI 芯片新出口限制的收入威胁。路透社。
评论