专栏中心

EEPW首页 > 专栏 > 英伟达打脸AMD:H100在软件加持下,AI性能比MI300X快47%!

英伟达打脸AMD:H100在软件加持下,AI性能比MI300X快47%!

发布人:芯智讯 时间:2023-12-23 来源:工程师 发布文章

image.png

12月14日消息,AMD于本月初推出了其最强的AI芯片Instinct MI300X,其8-GPU服务器的AI性能比英伟达H100 8-GPU高出了60%。对此,英伟达于近日发布了一组最新的H100与MI300X的性能对比数据,展示了H100如何使用正确的软件提供比MI300X更快的AI性能。

根据AMD此前公布的数据显示,MI300X的FP8/FP16性能都达到了英伟达(NVIDIA)H100的1.3倍,运行Llama 2 70B和FlashAttention 2 模型的速度比H100均快了20%。在8v8 服务器中,运行Llama 2 70B模型,MI300X比H100快了40%;运行Bloom 176B模型,MI300X比H100快了60%。

但是,需要指出的是,AMD在将MI300X 与 英伟达H100 进行比较时,AMD使用了最新的 ROCm 6.0 套件中的优化库(可支持最新的计算格式,例如 FP16、Bf16 和 FP8,包括 Sparsity等),才得到了这些数字。相比之下,对于英伟达H100则并未没有使用英伟达的 TensorRT-LLM 等优化软件加持情况下进行测试。

AMD对于英伟达H100测试的隐含声明显示,使用vLLM v.02.2.2推理软件和英伟达DGX H100系统,Llama 2 70B查询的输入序列长度为2048,输出序列长度为128。

而英伟达最新公布的对于DGX H100(带有8个NVIDIA H100 Tensor Core GPU,带有80 GB HBM3)测试,带有公开的NVIDIA TensorRT LLM软件,v0.5.0用于Batch-1,v0.6.1用于延迟阈值测量。工作量详细信息与脚注与AMD之前的测试相同。

image.png

结果显示,与 AMD展示的MI300X 8-GPU服务器性能相比,英伟达DGX H100 服务器在使用优化的软件加持后,速度提高了 2 倍多,相比 AMD MI300X 8-GPU 服务器快了47%。

DGX H100 可以在1.7 秒内处理单个推理任务。为了优化响应时间和数据中心吞吐量,云服务为特定服务设置了固定的响应时间。这使他们能够将多个推理请求组合成更大的“Batch”,并增加服务器每秒的总体推理次数。MLPerf 等行业标准基准测试也使用此固定响应时间指标来衡量性能。

响应时间的微小权衡可能会导致服务器可以实时处理的推理请求数量产生不确定因素。使用固定的 2.5 秒响应时间预算,英伟达DGX H100 服务器每秒可以处理超过 5 个 Llama 2 70B 推理,而Batch-1每秒处理不到一个。

显然,英伟达使用这些新的基准测试是相对公平的,毕竟AMD也使用其优化的软件来评估其GPU的性能,所以为什么不在测试英伟达H100时也这样做呢?

要知道英伟达的软件堆栈围绕CUDA生态系统,经过多年的努力和开发,在人工智能市场拥有非常强大的地位,而AMD的ROCm 6.0是新的,尚未在现实场景中进行测试。

根据AMD之前透露的信息显示,其已经与微软、Meta等大公司达成了很大一部分交易,这些公司将其MI300X GPU视为英伟达H100解决方案的替代品。

AMD最新的Instinct MI300X预计将在2024年上半年大量出货,但是,届时英伟达更强的H200 GPU也将出货,2024下半年英伟达还将推出新一代的Blackwell B100。另外,英特尔也将会推出其新一代的AI芯片Gaudi 3。接下来,人工智能领域的竞争似乎会变得更加激烈。

编辑:芯智讯-浪客剑


专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们

关键词: 英伟达

相关推荐

莱迪思联手英伟达推出 Sensor Bridge 方案 加速边缘 AI 产品落地

布局全域 AI 治理:英伟达与 SERVICENOW 落地桌面智能代理与数据中心管控体系

先进节点产能被大厂锁定,芯粒与先进封装成中小厂商突围之路

2026-05-12

瞄准光通信!英伟达27亿美元“绑定”康宁

2026-05-08

英伟达CFO:我们早就知道内存大涨价要来了

2026-05-24

大嘴业话——ARM再次上市,究竟7年时间算不算被偷走的?(1)

视频 2023-11-06

英伟达携手合作伙伴将在变电站旁建微型数据中心

英伟达与IREN达成战略合作,共建5GW规模AI基础设施

软银携手英伟达与富士康,打造“日本制造”AI服务器

大嘴业话——ARM再次上市,究竟7年时间算不算被偷走的?(2)

视频 2023-11-07

维拉 CPU 交付:英伟达首款面向智能体的 CPU 进驻顶尖 AI 实验室

智能计算 2026-05-20

《E点冷知识》:引发AI行业大地震的CUDA究竟有多强大

视频 2024-03-26

GPU的形态已彻底改变,英伟达GTC大会发布的到底是什么

视频 2024-03-26

大嘴业话——英伟达宣布进军CPU市场

视频 2023-11-10

英伟达 2027 财年 Q1 财报:营收利润双创新高,AI 算力需求持续爆发

更多 培训课堂
更多 焦点
更多 视频

技术专区