NVIDIA GeForce RTX5090与RTX4090 — 新halo GPU对比

—— NVIDIA在 AI 和新功能上押注甚至比 40 系列还要多。

作者：时间：2025-01-09 来源：Toms hardware

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

Blackwell RTX 50 系列 GPU 标志着自 2022 年底推出 RTX 40 系列 Ada Lovelace GPU 以来长达两年多的等待结束。NVIDIA在 CES主题演讲期间宣布了即将推出的 GeForce RTX 2025 系列显卡，提供了规格、定价，甚至性能预览。作为新的 halo 部件，RTX 5090 取代了 RTX 4090，拥有更多的内存、更多的计算、更多的功能和更多的功能。它尚未上市，但在卡片开始销售之前，有很多事情值得剖析。

本文引用地址：https://www.eepw.com.cn/article/202501/466160.htm

RTX 5090 到货时会成为最好的显卡之一吗？如果 “最好 ”是指 “最快 ”，那么是的，毫无疑问它将超越它的前身。它会快两倍吗？也许取决于你想要如何测量性能，但这会让人们非常信任与传统渲染不同的 AI 技术。让我们深入研究我们所知道的规格和功能，以讨论 GPU 世界的新旧之王如何评估。

让我们先谈谈原始规格。RTX 5090 有 170 个 Blackwell 流多处理器（SM），而 4090 有 128 个 SM。这意味着 GPU 核心增加了 33%，而 CUDA 核心、张量核心、RT 核心、纹理单元等的数量与 SM 数量直接相关，因此总体上基本上增加了 33%。

然而，时钟速度也起着一定的作用，4090 的升压时钟为 2520 MHz，而（根据计算和 NVIDIA的官方规格）升压时钟为 2407 MHz。这意味着对于原始计算，5090 “仅”比 4090 提高了 27%。但是，这是假设不存在其他体系结构差异，这几乎可以肯定不是一个好的假设。

RTX 5090 的内存容量、速度和带宽都更高，这要归功于 GDDR7 以及更大、更坚固的芯片。RTX 5090 的 VRAM 比 4090 多 33%，频率高出 33%，原始带宽净提升 78%。我们不知道 L2 缓存大小，也不知道是否有任何其他可能影响带宽的变化，这两者都是重要的考虑因素。尽管如此，这还是原始内存带宽的大幅增加。

NVIDIA在 RTX 50 系列的 AI 上押注很大，这就是我们看到的一些最大变化的地方。RTX 4090 具有 661 TFLOPS 的 FP16 张量计算（具有稀疏性）和 1321 TOPS（万亿次）的 INT8 张量计算（同样具有稀疏性）。这远远超过了 AMD 的 RX 7900 XTX，后者仅提供 FP16 / INT8 计算的 123 TFLOPS / TOPS（无稀疏性）。但与 RTX 5090 相比，它仍然相形见绌。

我们不确定 FP16 的数字，但假设 NVIDIA遵循与上一代相同的比率，RTX 5090 将提供高达 1676 TFLOPS 的张量 FP16 计算，是 3352 TOPS 张量 INT8 计算的两倍（两者都具有稀疏性）。新一代的 AI 计算性能提高了 154%（2.54 倍）。NVIDIA打算充分利用 AI 的潜力。

显卡	RTX 5090	RTX 4090
架构	GB202	AD102
进程节点	台积电 4NP	台积电 4N
晶体管（十亿）	92	76.3
芯片尺寸（mm^2）	744	608.4
短信	170	128
GPU 着色器	21760	16384
Tensor 核心	680	512
RT 核心	170	128
升压时钟（MHz）	2407	2520
VRAM 速度（Gbps）	28	21
显存（GB）	32	24
VRAM 总线宽度	512	384
L2 缓存	128?	72
渲染输出单位	240?	176
纹理映射单位	680	512
TFLOPS FP32 （升压）	104.8	82.6
TFLOPS FP16 （INT8 TOPS）	1676?(3352)	661 (1321)
带宽（GB/s）	1792	1008
TBP（瓦特）	575	450
发布日期	2025 年 1 月	2022 年 10 月
发布价格	1,999 美元	1,599 美元

（图片来源：Nvidia）

正如我们在其他地方讨论的那样，NVIDIA DLSS 4 将利用 Blackwell 中的新功能来支持其 AI 算法。多帧生成将“预测未来”，并从一个渲染（可能放大）的帧生成最多三个额外的帧。因为它使用的是帧投影而不是插值，所以延迟损失应该与我们已经看到的 DLSS 3 帧生成没有太大区别，但额外的帧将使一切看起来更流畅。

那实际感觉如何？我们自己还没有机会测试它，所以我们保留任何最终判断，但我们对此持怀疑态度。它可能会正常工作，但一个基于用户输入的渲染帧后跟三个 AI 生成的没有新用户输入的帧，与每一帧都接受任何新用户输入并完全渲染的游戏感觉不同。

然而，还有其他变化即将到来，其中一些是 Blackwell RTX 5090 独有的，而另一些将与旧的 RTX 卡一起使用。RTX Neural Materials 似乎使用 AI 压缩和学习将游戏中使用的纹理和材质描述的内存需求降低了约三分之一。但是，硬件管道需要能够将 AI 与着色器一起使用才能完成这项工作，因此这将是另一个 50 系列独有的。

另一方面，DLSS Transformer 升级使用基于 AI Transformer 构建的新训练网络，而不是早期 DLSS 升级算法中使用的卷积神经网络（CNN）。Transformer 一直是 AI 革命的核心，为 ChatGPT、DALL-E 和其他 AI 内容生成器等产品提供支持。NVIDIA展示的新旧 DLSS 升级示例视频看起来非常令人印象深刻，我们渴望亲自尝试。更重要的是，新的 DLSS Transformer 算法显然比旧的 CNN 版本运行得更快，并且适用于所有 RTX GPU。

NVIDIA自己的性能预览表明 RTX 5090 的速度可以提高到 RTX 4090 的两倍，还展示了一些游戏在一个实例中没有 DLSS 4 甚至 DLSS 3 来搅浑水。从《孤岛惊魂 6》的结果来看，在新的 AI 功能不属于等式的游戏中，5090 的性能似乎将比 4090 高出约 27%。在《瘟疫传说：安魂曲》中，差距增加到大约 43%（是的，我正在数像素！而在使用 DLSS 4 MFG（与 DLSS 3 FG 相比）的游戏中，NVIDIA的改进为 2.3 倍到 2.45 倍。

这是否意味着 RTX 5090 值得或不值得更高的价格？我们认为这在很大程度上取决于您在做什么。几乎可以肯定，会有很多对 AI 感兴趣的人和公司会抓住机会花 1,999 美元购买 RTX 5090。在过去的几年里，这些群体一直在购买 RTX 4090 卡。在生成式 AI 测试中，使用 Flux.dev 时，5090 的性能也出现了 2 倍的巨大跃升。

但是，如果您主要玩游戏，并且不喜欢帧生成？坐下来等待一段时间，看看事情如何发展可能不是一个坏主意。也许 DLSS 4 在实际使用中看起来和感觉都很棒。或者，也许通过新的 575 针连接器拉动高达 16W 的功率将导致 Meltgate 第 2 部分。但无论你怎么切分，花在游戏 GPU 上都是很多钱——你肯定会希望你的 PC 的其余部分能够完成这项任务，因为为 RTX 5090 提供动力并提供稳定的游戏更新流需要一台非常强大的 PC。

新闻中心

NVIDIA GeForce RTX5090与RTX4090 — 新halo GPU对比

评论

相关推荐

技术专区