新闻中心

EEPW首页 > 智能计算 > 业界动态 > 英伟达推出开源推理软件Dynamo 为AI工厂降本增效

英伟达推出开源推理软件Dynamo 为AI工厂降本增效

作者：时间：2025-03-19 来源：网易科技

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

收藏

3月19日消息，英伟达在2025GTC大会上推出了开源 推理软件 NVIDIA Dynamo，旨在以高效率、低成本加速并扩展 AI 工厂中的 AI 推理模型。

本文引用地址：https://www.eepw.com.cn/article/202503/468317.htm

据介绍，NVIDIA Dynamo 是一款全新的 AI 推理服务软件，旨在为部署推理 AI 模型的 AI 工厂最大化其 token 收益。它协调并加速数千个 GPU 之间的推理通信，并使用分离服务将大语言模型 (LLM) 的处理阶段和生成阶段在不同 GPU 上分离开来。这使得每个阶段的特定需求可以进行单独优化，并确保更大程度地利用 GPU 资源。

“全世界各行业都在训练 AI 模型以不同的方式进行思考和学习，从而使模型复杂度持续升级。”NVIDIA 创始人兼首席执行官黄仁勋表示，“为了实现自定义推理 AI 的未来，NVIDIA Dynamo 可以在这些模型上进行规模化部署，从而为 AI 工厂实现降本增效”。

在 GPU 数量相同的情况下，Dynamo 可将 NVIDIA Hopper™ 平台上运行 Llama 模型的 AI 工厂性能和收益翻倍。在由 GB200 NVL72机架组成的大型集群上运行 DeepSeek-R1模型时，NVIDIA Dynamo 的智能推理优化也可将每个 GPU 生成的 token 数量提高30倍以上。

NVIDIA Dynamo 完全开源并支持 PyTorch、SGLang、NVIDIA TensorRT™-LLM 和 vLLM，使企业、初创公司和研究人员能够开发和优化在分离推理时部署 AI 模型的方法。

这将使用户加速采用 AI 推理，包括亚马逊云科技、Cohere、CoreWeave、戴尔科技、Fireworks、谷歌云、Lambda、Meta、微软 Azure、Nebius、NetApp、OCI、Perplexity、Together AI 和 VAST。

<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a7a83b30&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a3d98779&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=abca108c&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a1775170&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a href='https://ad.eepw.com.cn/www/delivery/ck.php?n=a449048b&cb=INSERT_RANDOM_NUMBER_HERE' target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

关键词： 英伟达 开源 推理软件 Dynamo AI工厂 NVIDIA Dynamo GTC

评论

相关推荐

NVIDIA、AMD「新款降规AI芯片」呼之欲出直面川普H20禁令

智能计算 NVIDIA AMD 降规AI芯片 H20禁令 | 2025-05-29

三星恐以拆分抢台积电订单想让苹果、英伟达变心

EDA/PCB 三星台积电苹果英伟达 | 2025-05-29

Nvidia DRIVE AGX Xavier上的ADI成像雷达

视频 ADI Nvidia DRIVE AGX | 2020-06-12

NVIDIA发布超级手机基于Tegra平台

视频 NVIDIA 手机 | 2011-01-20

一个自己制作u盘的开源项目 - www.lumit.org

lumit | 2004-08-27

开源1000款嵌入开发板资料光盘免费下载地址---非常难得

资源下载开源嵌入光盘免费下载地址 | 2013-10-03

开源的 JAIN-SLEE SIP 软交换 -- Mobic...

资源下载开源 JAIN-SLEE 软交 Mobicents | 2013-09-18

大嘴业话——英伟达宣布进军CPU市场

视频英伟达 AI CPU | 2023-11-10

Nvidia将Ada和SPARK引入无人驾驶汽车

汽车电子 Nvidia Ada SPARK引入无人驾驶汽车 | 2025-06-05

Nvidia 800VDC数据中心结构

网络与存储 Nvidia 800V DC 数据中心 | 2025-05-28

开源小四轴资料.zip

资源下载开源四轴资料 | 2013-09-23

英伟达新款中国特供芯片：放弃Cowos封装和HBM

英伟达芯片 Cowos 封装 HBM | 2025-05-27

Nvidia MCP55P Desige guide

资源下载 Nvidia MCP55P Desige guide | 2013-09-18

英伟达Arm PC芯片亮相即巅峰？

英伟达 Arm PC 芯片 SoC 处理器联发科 | 2025-06-12

英伟达CSO：美国AI禁令让中国抢走大量AI研发人才

英伟达 AI | 2025-06-10

ARM.新闻稿

资源下载 Zilog ARM 32位微控制器嵌入式 MCU SoC Cortex-M3 多核处理器消费电子 Mali-400 MP NVIDIA Tegra 高度优化下一代机顶盒纳米片上系统 | 2009-04-12

英伟达推动 Ada 和 SPARK 进入无人驾驶汽车

汽车电子英伟达自动驾驶 Ada | 2025-06-05

大嘴业话——ARM再次上市，究竟7年时间算不算被偷走的？（2）

视频 AI 英伟达 ARM | 2023-11-07

大嘴业话——ARM再次上市，究竟7年时间算不算被偷走的？（1）

视频英伟达嵌入式 ARM 软银 | 2023-11-06

一个自己制作u盘的开源项目 - www.lumit.org

lumit | 2004-08-27

2005中国软件技术大会

麦莎就是我 | 2005-11-18

[开源] UML State machine Wizard 6.1

stan2005 | 2005-08-14

NVIDIA 800V数据中心配电系统成形功率芯片三雄拔头筹

网络与存储 NVIDIA 800V 数据中心配电系统 | 2025-05-28

英伟达GB300回归Bianca设计

英伟达 GB300 Bianca Cordelia | 2025-05-29

NVIDIA获ARM授权，为图形处理器增添应用处理功能

xiaosongs | 2005-10-19

焦点

推荐视频

技术专区

关闭