英伟达 vs AMD：战场已移至 1000 美元区间

作者：时间：2024-01-03 来源：半导体产业纵横

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

英伟达和 AMD 再次几乎同步地将新一代专业 GPU 推向市场。英伟达最新的 Ada Generation GPU 催生了两款适用于固定/桌面工作站的超高端产品：RTX 5000 Ada 和 RTX 6000 Ada GPU（更不用说适用于移动工作站的 GPU 模块）。AMD 推出 Radeon Pro W7900 和 W7800 进行反击。所有四种产品的售价均超过 2,000 美元，对于大多数工作站用户来说都太丰富了。现在，这两家公司正在与下一代图形处理器英伟达的 RTX 4000 Ada Generation 和 AMD 的 Radeon Pro W7700 进行另一场势均力敌的较量，在利润更丰厚的 1000 美元范围内展开竞争。

本文引用地址：https://www.eepw.com.cn/article/202401/454417.htm

Jon Peddie Research 认为，虽然产品具有可比性，但一旦进入市场，供应商各自的产品并没有获得同样的成功，差异是明显的。今天，英伟达的外接式 GPU 在固定工作站上的销量约占总销量的 97%，而在移动 GPU 服务于蓬勃发展的移动工作站市场的背景下，这一数字甚至更高。

要想打破这一市场现状，需要英伟达出现问题，而 AMD 则必须完美执行虽然 AMD 的执行力并不完美，但该公司也很难掉链子。相反，AMD 的问题在于英伟达最近没有提供任何有意义的失误供 AMD 利用。因此，随着这两款竞争产品服务于相同（大约）1,000 美元的 ASP 社区，我们在基准测试中看到了一些熟悉的结果组合。英伟达的 3D 图形性能胜过 AMD，但差距不大（尽管如果渲染方面也能达到同样的效果，这一点还有待商榷），而 AMD 更友好的定价使其在性价比方面与英伟达类似。

如果 Radeon Pro W7700 能够在性能和性价比上脱颖而出，那么双插槽与单插槽的问题就不会是一个重要的问题。而对很多人来说，可能还是一句「不在乎」。但是，如果两者在其他方面旗鼓相当（考虑到当今市场很大程度上将英伟达视为默认品牌），那么 W7700 更需要更多瓦特，并且可能会取代插槽（取决于主板），那么这对 Radeon Pro W7700 的前景并无帮助。

虽然这一轮更新不太可能显著提高市场份额，但如果您只是想配置新工作站的用户，这可能并不重要。对于高端市场，最大性能更可能是关键的购买标准，而在低端市场，价格将脱颖而出。在这些最新 GPU 的 1,000 美元级别中，性价比起着更重要的作用。因此，AMD 的性价比可能会激起用户的兴趣，而大多数买家将继续选择 4000 系列 RTX Ada，由于其在工作站供应商的配置选项中更广泛的可访问性，这一前景更有可能。专业买家的底线是什么？似乎没有明确的正确或错误答案，各种类型的用户都可以从两家供应商一代又一代的性能提升中受益。

英伟达 vs AMD：战场已移至 1,000 美元区间

英伟达和 AMD 的 GPU 组合在芯片开发和后续产品推出方面的一致性确实让笔者感到惊讶。也许不应该，相反，也许这是一种应该给人留下深刻印象的模式。因为当笔者停下来考虑现代 GPU（或 CPU）的生产这项艰巨的任务时，两家供应商在执行中很少出现失误，这一事实应该给人留下深刻的印象。虽然他们各自的产品并不总是处于平等的地位，但很少会看到一个人在没有得到对方及时和相应的回应的情况下，通过一些戏剧性的代际进步让对方完全措手不及。

因此，它一直在市场上寻找配备现代固定和移动工作站的专业级独立 GPU。英伟达的 Ada 和 AMD 的 RDNA 3 代的不断推出就证明了两者的新一代微架构往往非常接近。这两代产品都已经出现在各自以工作站为中心的 RTX 和 Radeon Pro 系列中，主要从高端开始，逐渐降低价格范围。

在过去的几个月里，英伟达最新的 Ada 一代 GPU 已经催生了两款适用于固定/桌面工作站的超高端产品——RTX 5000 Ada 和 RTX 6000 Ada GPU——以及大量适用于移动工作站的 GPU 模块。与此同时，AMD 推出了自己的两款高价选项：Radeon Pro W7900 和 W7800。这四款产品的零售价均超过 2,000 美元，超出了大多数工作站用户的承受能力。但它们的出现预示着这两家公司下一代产品的下一个可能价格点：利润丰厚的 1,000 美元范围。果然，两者都实现了这一期望，前者的 RTX 4000 Ada Generation，现在与后者的 Radeon Pro W7700 相媲美。

RTX 4000 Ada

对 RTX 4000 Ada Generation 的显著硬件指标的扫描显示，其资源数量（尤其是 CUDA 核心、Tensor 核心和 RT 核心）与其前身 Ampere 一代 RTX A4000 基本相同。因此，RTX 4000 性能的大部分改进将归因于架构增强和/或更高频率的执行。一个值得注意的例外是峰值内存带宽，它实际上会降低。提高电源效率可能是设计选择背后的动机，因为外部接口上节省的电力可以用在其他地方（例如时钟）。但这也证明了 Ada 的架构效率（和板载缓存），它可以用更少的总带宽实现更高水平的性能。

表 1：RTX 4000 Ada 、 RTX 5000 Ada 及其前身 RTX A4000 的主要硬件指标。（来源：英伟达）

Radeon Pro 7700

AMD 的 RDNA 3 代 Radeon Pro 预计将于 2023 年 4 月首次宣布部署工作站，最初由两个 SKU 组成：Radeon Pro W7800 和 W7900。与英伟达的第一代 Ada Generation RTX 6000 和 RTX 5000 一样，两者都非常昂贵，零售价分别约为 2,500 美元和 4,000 美元。但与英伟达一样，AMD 最近又进一步降低了价格曲线，W7700 的售价约为 1,000 美元。

RDNA 3 的进步也与 Ada 一样，沿着相同路径推动资源和性能：用于通用计算和 3D 图形的更快的流处理器，改进的（第二代）RT 加速器以加速渲染的路径跟踪，以及针对机器学习（训练和推理）进行调整的人工智能加速器。

表 2：RDNA 第三代 Radeon Pro W7700 的主要硬件指标。（来源：AMD）

RDNA 3 的 Radiance 显示引擎是 RDNA 3 与众不同的一项资源，与 RTX 的 DP 1.4a 相比，它支持更新、更高带宽的 DisplayPort 2.1。在物理层，DP 2.1 使带宽增加了一倍以上，意味着更高分辨率、更高刷新率、更多显示器，或三者的某种组合。它还允许选择 12 位 HDR 颜色 (4:4:4)，无需色度二次采样，以满足最视觉精确的要求。

不过，W7700 还有一个方面与 RTX 4000 不同，这一点一目了然：后者是单宽度 PCI Express 卡，而前者是双宽度。外形尺寸选择反映了各自的散热和电源规格：RTX 4000 Ada 为 130W，Radeon Pro W7700 为 190W。当然，两者都使用单个 PCIe x16 插槽，但双宽卡会占用更多空间，并且可能会阻塞第二个 PCIe 插槽，具体取决于主板和机箱。大多数迷你或全尺寸塔式工作站将支持双宽卡（以及更高的功率要求）。有趣的是，正是在 GPU 频谱中这个 1000 美元左右、150W 左右的点上我们看到了这种外形尺寸差异。在此级别之上，两家供应商的产品都是双宽度的，在该级别之下，它们都是单宽度的。

单宽度 RTX 4000（左）和双宽度 Radeon Pro W7700（右）

RTX 5000 Ada 提升 3D 图形和 3D 渲染的视觉计算性能

当谈到更传统的交互式 3D 图形时，SPECviewperf（最新的 2020 版本）仍然是 CAD 和其他专业视觉处理工作负载较多的应用程序的首选基准。使用 SPECviewperf 2020 进行测试得出以下结果，在相同的高性能系统上运行，交换 RTX 4000 Ada Generation、之前的 Ampere Generation RTX A4000 和 AMD Radeon Pro W7700。

RTX 5000 Ada Generation GPU 在 SPECviewperf 2020 视图集上的运行速度平均比 RTX A5000 快 56%（A6000 Ada Generation 大约快 73%）。

RTX 4000（和 5000）Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 分数，标准化为英伟达 Ampere 一代 RTX A4000。

然而，当我们考虑性价比时，情况就发生了逆转，因为 AMD Radeon Pro W7700 的 ASP 更易于访问，使其比英伟达 RTX 4000 Ada 更具优势。

RTX 4000（和 5000）Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 性价比得分，标准化为英伟达 Ampere 一代 RTX A4000。

最后，从电源效率的角度来看，尽管在固定/有线工作站的环境中（对于大多数人来说）这是一个较小的问题。相反，RTX 4000 Ada 的每瓦分数较低，其较低的最大持续功耗使其每瓦性能领先于此处对比的所有同类 GPU。请记住，这些结果并不反映达到相应分数所消耗的实际功耗，而是反映电路板为确保热容限和电容限而可以消耗的持续功率限制。

RTX 4000（和 5000）Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 每瓦得分，标准化为英伟达 Ampere 一代 RTX A4000。

渲染：GPU 视觉处理不仅限于 3D 图形

虽然 3D 图形仍然是大多数视觉计算工作流程的基础，但它不再是唯一需要评估的 GPU 功能。随着片上光线追踪硬件的出现，以及 GPU 在通用计算和机器学习方面能力的不断提高，下一代 GPU 有更多的价值可供开发。

得益于普遍的应用程序支持、更快的 CPU，以及（特别是在本次评测中）GPU 加速和支持软件库，渲染曾经是一种奢侈品，现在在工作站市场中变得越来越容易使用。除了简单地提供比上一代 Ampere 芯片更多的 CUDA、RT 和 Tensor 核心之外，英伟达在转向 Ada 时还提高了每个核心的性能和功能（具有第四代 Tensor 核心和第三代 RT 核心架构）。例如，RT 核心本身已经升级，英伟达声称光线追踪吞吐量比 Ampere 提高了 2 至 3 倍。虽然 3D 图形处理主要依赖于 CUDA 核心，但它的渲染代表了利用所有三个核心功能的算法的十字路口。

考虑 DLSS 3，它扩展了之前在 Ampere 和 Turing DLSS 以及 DLSS 2（Ampere 的前身）中利用的 AI/渲染协同作用。前面的算法利用机器学习来智能地填充像素或光线（其数量与渲染时的视口像素相关），从而缩短到达最终渲染图像所需的时间。在 Ada 中，DLSS 3 将其带入逻辑上的下一步，但是在时间域而不是空间域。DLSS 3 不是在同一帧内填充像素或光线，而是允许经过训练的神经网络创建中间帧，从而提高帧速率，同时减少暴力视觉处理。

RTX 4000 Ada 和上一代 RTX A4000 的测试结果充分证明了 Ada 在所有处理核心上的先进能力，前者在 Blender Cycles 基准测试中比后者高出 41%（三个场景分数的几何平均值），利润率甚至高于 SPECviewperf 2020 的 3D 图形。

RTX 4000 Ada 和 RTX 5000 Ada 的 Blender Cycles 渲染基准测试结果，标准化为 Ampere 一代 RTX A4000。

随着 Maxon 的 Cinebench 2024 的推出，笔者终于找到了比较英伟达和 AMD GPU 加速渲染的公平基础。前几代 Cinebench 或 Blender Cycles 或 LuxRender 等其他基准测试如果没有对供应商首选优化库（英伟达的 CUDA 或 AMD 最新的 HIP RT）的嵌入式支持，将使英伟达或 AMD 处于不利地位。另一方面，Cinebench 2024 现在支持两者，测试显示 RTX 4000 Ada 的性能比其前身 RTX A4000 高出 41%，而 Radeon Pro W7700 的帧速率约为后者的 85%。

RTX 4000 Ada 和 RTX AMD Radeon Pro W7700 的 Cinebench 2024 渲染基准测试结果，标准化为 Ampere 一代 RTX A4000。

虽然视觉处理（主要是 3D 图形，但越来越多的渲染）仍然是专业 GPU 工作负载的大部分，但加速其他计算已经扩大了其效用。如今，人工智能占据主导地位，GPU 通常被视为训练和推理的首选引擎。SPECworkstation 的 GPU 计算测试套件可以在一定程度上深入了解 GPU 对深度学习（使用 Caffe）和科学研究（使用 FAH 或 Folding@home）的益处，以及另一个使用 LuxRender 提供额外渲染数据点的套件。

在同一测试系统上运行 SPECworkstation 3.1，英伟达的 RTX 4000 Ada Generation 在 GPU 计算测试套件上的性能比其前身 RTX A4000 高出 20%。按绝对值计算，英伟达 GPU 在特定于 GPU 的测试中的性能不会是最佳的，因为这些测试支持 OpenCL，而不是英伟达自己的 CUDA 加速库。然而，从一代又一代的角度来看，分数应该提供另一个合适的参考，表明 Ada 相对于 Ampere 的性能进步。