英伟达CEO黄仁勋:AI是个五层蛋糕
英伟达CEO黄仁勋罕见发布个人署名文章《AI是个五层蛋糕》。他指出,AI不是单一模型或应用,而是一个正在形成的“五层蛋糕”基础设施体系 —— 能源、芯片、基础设施、模型、应用,还需数万亿美元建设。

以下为全文:
人工智能是当今塑造世界最强大的力量之一。它不是一个应用,也不是单一模型,而是如同电力和互联网一般的关键基础设施。
人工智能的运行依托于切实的硬件、能源与经济规律。它消耗原材料,并将其大规模转化为智能产出。每一家企业都将应用它,每一个国家都将构建它。
若要理解人工智能为何以此种态势演进,我们需要回归「第一性原理」,审视计算领域所发生的根本性变革。

从预制软件到实时智能
在计算机历史的大部分时间里,软件都是「预制」的。人类定义算法,计算机执行指令。数据必须经过严密的结构化处理,存储在表格中,并通过精确的查询语句进行检索。SQL之所以变得不可或缺,正是因为它让那个时代的运作成为可能。
人工智能打破了这一模式。
我们首次拥有了能够理解非结构化信息的计算机。它能识别图像、阅读文本、聆听声音并领会其背后的含义。它能够针对语境和意图进行逻辑推理。最重要的是,它能够实时智能响应。
每一条回复都是全新生成的。每一个答案都取决于您提供的上下文。这并非软件在检索预存的指令,而是软件在进行推理并按需生成智能。
正因为智能是实时产出的,其底层的整个「计算堆栈(Computing Stack)」都必须经历彻底的变革与重构。

AI as Infrastructure
从工业视角审视,人工智能可被解构为一套五层架构(Stack)。
· 能源(Energy)
能源是整套架构的基石。实时生成的智能需要实时产生的电力作为支撑。生成的每一个Token都是电子移动、热量管理以及能源转化为计算能力的产物。
在此之下不存在更底层的抽象层。能源是AI基础设施的「第一性原理」,也是决定系统智能产出上限的硬约束。
· 芯片(Chips)
能源之上是芯片。这些处理器旨在将能源大规模、高效率地转化为计算力。AI工作负载需要极高的并行性、高带宽内存(HBM)以及高速互连技术。
芯片层的技术突破决定了AI扩张的速度,以及智能获取成本的经济性。
· 基础设施(Infrastructure)
芯片之上是基础设施。这涵盖了土地、电力传输、冷却系统、建筑施工、网络连接,以及将数以万计的处理器编排为单一算力集群的系统。
这些系统本质上是 「AI工厂」。它们的设计初衷并非存储信息,而是为了「制造智能」。
· 模型(Models)
基础设施之上是模型。AI模型能够理解多种维度信息:语言、生物学、化学、物理学、金融、医学以及物理世界本身。
语言模型仅是其中一个类别,目前最具变革性的突破正发生在蛋白质AI、化学AI、物理模拟、机器人技术以及自主系统领域。
· 应用(Applications)
最顶层是应用,这是创造经济价值的核心环节。包括:药物研发平台、工业机器人、法律助手(Copilot)、自动驾驶汽车。
自动驾驶汽车是具身智能在机器中的AI应用,而人形机器人则是「具身」于躯体之中的AI应用。底层架构相同,展现形态各异。
这就是所谓的「五层蛋糕」:能源 → 芯片 → 基础设施 → 模型 → 应用。
每一个成功的应用都在拉动其下方的每一层架构,其根源可追溯至维持其运行的发电厂。
这一建设进程才刚刚开启。我们目前的投入仅为数千亿美元,未来仍有数万亿美元规模的基础设施尚待建设。
在全球范围内,芯片工厂、计算机组装厂和AI工厂正以史无前例的规模动工。这正在演变为人类历史上规模最大的基础设施建设运动。
支撑这一建设进程所需的劳动力是巨大的。AI工厂需要电工、水管工、管工、钢结构工人、网络技术人员、安装人员和操作人员。
这些岗位属于高技能、高薪酬且供不应求的职业。投身这场变革,并不一定需要计算机科学博士学位。
与此同时,AI正在提升整个知识经济的生产力。以放射医学为例:尽管AI现在可以辅助阅片,但对放射科医生的需求却在持续增长。这并非悖论。
放射科医生的核心宗旨是护理患者,阅片仅是诊疗过程中的一个环节。当AI承担了更多常规化工作,医生便能专注于专业判断、医患沟通和人文关怀。医院的效率由此提高,能够接诊更多患者,并雇佣更多员工。
生产力创造产能,产能驱动增长。
过去一年发生了什么变化?
在过去的一年中,人工智能跨越了一个重要的门槛。模型的能力已足以支撑大规模的实际应用。逻辑推理能力显著增强,幻觉比例下降,而知识对齐与事实性(Grounding)则得到了大幅提升。基于AI构建的应用首次开始产生真正的经济价值。
在药物研发、物流运输、客户服务、软件开发及制造业等领域,相关应用已经展现出强劲的产品市场契合度。这些应用正强力拉动其底层的每一个技术架构层级。
开源模型在此发挥着至关重要的作用。全球绝大多数模型都是免费的。研究人员、初创企业、大型企业乃至整个国家,都依赖开源模型来参与前沿人工智能的竞争。当开源模型触及技术边界时,它们改变的不只是软件,更是激活了对整个架构堆栈的需求。
DeepSeek-R1就是一个强有力的例证。通过将性能强劲的推理模型向公众开放,它加速了应用层的普及,进而反向刺激了底层对模型训练、基础设施、芯片以及能源的需求。

这意味着什么?
当你将人工智能视作关键基础设施时,其深层影响便清晰可见。
人工智能始于基于Transformer架构的大语言模型(LLM),但其内涵远不止于此。它是一场工业变革,正在重塑能源的生产与消费方式、工厂的建设模式、劳动的组织形式以及经济的增长路径。
AI工厂之所以拔地而起,是因为智能现已实现实时生成。芯片之所以被重新设计,是因为能效比决定了智能扩张的速度。
能源之所以成为核心,是因为它设定了智能产出总量的绝对上限。应用开发之所以提速,是因为其底层的模型已跨越技术门槛,真正具备了大规模实用价值。
架构中的每一个层级都在相互强化、协同演进。

这正是建设规模如此宏大的原因。这也是为何它能同时触及如此众多的行业,且绝不会局限于单一国家或单一领域。每一家企业都将应用人工智能,每一个国家都将致力于其建设。
我们仍处于早期阶段。大部分基础设施尚未落成,大部分劳动力尚未接受相关培训,而大部分机遇也尚未被发掘。
但前进的方向已然明确。

人工智能正在成为现代世界的基石性基础设施。我们当下的抉择 —— 建设的速度、参与的广度以及部署的责任感 —— 将共同定义这个时代。












评论