英伟达CES主题演讲中的五点想法
上周CES活动的亮点之一是由首席执行官黄仁森发表的英伟达公司主题演讲。尽管CES这样的活动有许多重点,但最普遍的主题是人工智能,而没有哪家公司比英伟达更能与人工智能紧密相连。
这就是为什么成千上万的人提前排队数小时,聆听公司领导者最新、最棒的愿景和产品新闻。虽然有很多好消息,但还有一些值得超越产品新闻的重要收获。
Agentic将成为应用的新接口
在他的主题演讲中,黄炳哲描绘了一个世界:我们许多工作任务的主要接口将转向代理代理。他举了几个例子,包括ServiceNow公司、Palantir Technologies公司和Snowflake公司。历史界面,如填写电子表格、命令行和事件图形用户界面,通常需要人工作,且通常需要人工作为产品间的集成点。
代理代理,如Nvidia Nemotron,不仅更简单,还能推理、使用工具、规划和搜索,减轻了当今工作中大量的繁重工作。我的研究发现,员工花了多达40%的时间管理工作,而非实际工作,而代理性经纪人可能会把这段时间归零。人们对人工智能抢走工作充满恐惧,但其中很大一部分价值在于让我们的生产力提升一个数量级,因为我们不再需要做那些低价值的事情。
代理性代理人是多面的
黄的谈话环节中较为有趣的部分之一是他谈到自己对多模型人工智能的“顿悟时刻”。他谈到了Perplexity如何利用多个大型语言模型获得最准确的结果。“我觉得这完全是天才之作,”黄说。“当然,在人工智能领域,我们会调用世界上最优秀的人工智能模型,在推理链的不同阶段回答不同的问题。这就是为什么人工智能需要具有多模型特性。”他补充说,这使得代理代理人能够为特定任务使用最佳模型。
黄博士进一步解释,除了多模型,代理人工智能还将实现多模态,以理解语音、图像、文本、视频、3D图形及其他通信形式。“多”的概念在部署模型中延续,因为人工智能需要多云,才能使模型能够驻留在最佳位置。重要的是要明白,在这里,多云包括混合云。随着机器人、边缘服务器及其他连接设备需要实时访问数据和模型,这一点变得尤为重要,这需要本地化服务。
人们多次将互联网与人工智能进行比较,我认为最大的相似点是,人工智能和互联网一样,最终会融入我们所做的一切,这就要求人工智能具备多模态、多模型和多云的特性。
英伟达持续重新定义网络
大公司经常进行收购,但对英伟达来说,或许没有比Mellanox更重要的收购。公司为获得网络能力支付了近70亿美元,而该业务现在每季度创造的收入超过70亿美元。虽然英伟达在CES上的主要基础设施发布是Vera Rubin平台,但正是网络使各个组件能够协同工作。Vera 是 CPU,Rubin 是 GPU,Vera Rubin NVL72 是 AI 超级计算机,72 块 Rubin GPU 和 36 个 Vera CPU 通过 NVLink(Nvidia 的网络产品之一)连接。
事实上,在CES载荷中发布的六项Vera Rubin平台中,有四项涉及网络,包括:
ConnectX-9 SuperNIC – 英伟达下一代网卡,专为应对Rubin显卡的巨大吞吐量而设计。200G SerDes 每显卡总带宽为 1.6Tb/sec,是之前版本的两倍。这本书是为适应大规模扩展的严苛设计的。
NVLink 6 交换机——允许单个机架内多个 GPU 作为一个处理器的互连。该系统优化为可扩展网络,每个机架提供260 TB/s带宽。
Spectrum-X 以太网光子学——集成硅光子学,解决功耗问题,提升数据中心的韧性,相较于传统或标准光缆。这套同包光学元件显著降低了功耗并延长了正常运行时间。旗舰SN6800提供高达409.6 Tb/秒的总带宽,支持512个800G以太网端口。
BlueField-4 DPU——这可以将许多网络功能从服务器端卸载出来。新DPU配备64个Arm Neoverse V2核心,并具备BlueField-3的6倍处理能力。
英伟达正在让存储实现AI原生
英伟达宣布了一项名为“上下文内存存储”的产品,公司将其定位为适合AI时代的存储架构。随着人工智能的兴起,英伟达重新思考了处理、网络,现在也在对存储做同样的调整。
在CES上,我与高级副总裁Gilad Shainer进行了交流,他是通过Mellanox收购加入公司的。在我们的对话中,我们讨论了计算、网络和存储紧密配合以提供最佳性能的重要性。Shainer 提出了一个有趣的观点,传统的存储层次不一定针对推理优化,而这正是上下文内存存储所带来的。
它从根本上重新定义了存储行业,将其从通用公用事业转变为专为代理推理时代设计的“AI原生”基础设施层。通过引入新的存储层级,该平台弥合了容量有限的GPU服务器存储与传统通用共享存储之间的关键差距,有效地将键值缓存转变为一流的可共享平台资源。
平台不再要求GPU在每回合对话或多步推理任务中重新计算昂贵的上下文,而是利用BlueField-4 DPU卸载元数据管理,并在整个计算舱间高速共享上下文。这一架构转变消除了此前阻碍GPU性能的“上下文墙”,使代币吞吐量提升了多达五倍,功耗效率提升了传统存储方式的五倍。
汽车创新持续加速
许多汽车行业的普通观察者认为创新已经放缓。这种看法源于大约半个十年前,业界开始谈论五级自驾,而我们似乎仍然离那个水平很远。然而,随着数字孪生、云到车的发展、摄像头视觉和人工智能的兴起,使汽车比以往任何时候都更安全、更智能。在主旨演讲中,黄明亮指出,基于新发布的Alpamayo敞篷车型打造的新奔驰CLA获得了欧洲新车评估计划(EuroNCAP)五星级安全评级。
Alpamayo(如图)将为汽车行业带来福音,因为它推出了全球首个基于思考和推理的杀音软件模型。与依赖模式识别且常常难以应对不可预测“长尾”场景的传统自动驾驶堆栈不同,Alpamayo采用视觉-语言-行动架构,进行逐步推理,使车辆通过“推理痕迹”解释其逻辑,解决复杂问题——如交通信号灯故障或异常施工区。
通过开源Alpamayo 1模型、AlpaSim模拟框架和1700小时的真实驾驶数据,英伟达为梅赛德斯-奔驰、捷豹路虎和Lucid等汽车制造商提供了强大的“教师模型”,可提炼成更小的量产级栈。该生态系统通过用透明、类人化的判断取代“黑匣子”决策,显著降低了实现四级自主性的门槛,最终加速了安全认证进程,并建立了实现大众市场自主部署所需的公众信任。
总结感想
英伟达CES主题演讲无疑充满了基于人工智能的创新。我对演示唯一的挑剔是,我希望公司先以影响力为主导,然后再进入技术部门。举例来说,黄炳哲详细讲解了它贡献的车型数量超过任何人,然后介绍了Alpamayo,最后谈到了奔驰的安全评分。他本应该先用梅赛德斯的数据点,因为那是社会影响,然后再引入技术。
在整个CES中,人们可以看到人工智能正在改变我们的工作和生活方式,而没有哪个厂商比英伟达更有效地实现了这一目标。它的主题演讲已成为这场充满高规格主题演讲的展会中的焦点活动,我不认为它的势头会很快减缓。









评论