英伟达Vera CPU首次Linux基准测试
Phoronix 今日发布了英伟达 Vera CPU 的首批基准测试结果,涵盖多款常用 Linux 测试程序。尽管测试由英伟达在圣克拉拉总部精心组织,但早期数据显示,Vera 在英伟达设定的目标负载下,性能可与 AMD 霄龙(EPYC)、英特尔至强(Xeon)产品一较高下。
Phoronix 受邀前往英伟达圣克拉拉总部,对这款即将面世的 88 核 CPU 进行测试。Vera 的独特之处在于,它未采用授权的 Arm 处理器核心,而是效仿苹果芯片模式,在完全自研的 “Olympus” CPU 核心上使用 ARM 指令集。这并非英伟达首次自研 CPU 核心 ——12 年前的 Tegra K1 芯片就搭载过 “Denver” 核心。但 Denver 是受移动功耗限制的桌面级 CPU,而 Vera 是拥有服务器级功耗支持的服务器级 “性能怪兽”,基准测试结果便是最好证明。

Phoronix 的迈克尔・拉贝尔对 Vera 进行了多维度测试,包括代码编译、内存综合测试、AV1 视频编码、Python、Java OpenJDK、文件压缩、Lua JIT 及数据库基准测试等。在大多数测试中,Vera 处理器性能强劲,可与 AMD 霄龙 “Turin”(都灵)单 / 双路配置处理器、英特尔 “Granite Rapids”(急流峡谷)至强芯片抗衡。拉贝尔评价称,Vera 展现出 “我在其他任何 ARM 或非 x86_64 处理器上从未见过的、可与英特尔 / AMD x86_64 CPU 匹敌的竞争力”。它虽未在多数测试中完胜,但性能与霄龙配置机型极为接近 —— 对英伟达首款自研服务器级核心而言,这一表现惊艳至极。
更令人印象深刻的是部分测试的单线程性能数据。以往,Arm 服务器厂商依靠堆砌核心数,在多线程负载中追平 AMD、英特尔,但 x86 的单线程性能始终难以企及。而在 Gem5 编译计时测试中,仅 AMD 霄龙 9575F 能在 “单核性能” 指标上超越英伟达 Vera;Linux 内核编译测试里,Vera 更是小幅领先一众服务器芯片,充分彰显 Olympus 核心的强劲实力。
从测试结果几何平均值来看,Vera 以明显优势领跑,这得益于其在 LuaJIT 快速傅里叶变换(FFT)、ClickHouse 数据库服务器、文艺复兴(Renaissance)Java 虚拟机(JVM)基准测试中的超强表现,在这些项目中它大幅甩开竞品。不过数据也存在局限性:拉贝尔指出,英伟达将首轮基准测试范围限定在 “目标市场与应用场景”,但测试项目均为他常用的服务器 CPU 性能分析工具,结果真实有效,只是无法代表所有工作负载场景。
Vera 的设计初衷是搭配 Rubin GPU 使用,同时英伟达也推出了仅搭载 Vera CPU 的服务器机型。
此次测试未能涉及的关键指标是能效。这一点对消费级系统影响有限,但对 AI 数据中心运营商至关重要 —— 全球电力基础设施难以支撑遍地开花的兆瓦级 AI 训练集群,能耗问题正制约行业发展。英伟达公布 Vera 的热设计功耗(TDP)为 450 瓦,搭配的高速 SOCAMM2 内存功耗为 50 瓦;对比测试用的至强、霄龙芯片,仅处理器 TDP 就达 500 瓦(不含平台内存功耗)。但实际功耗与 TDP 理论值往往差异较大,真实表现仍需进一步验证。
Vera 的另一大优势是软件生态支持。拉贝尔表示,Vera“对上游开源软件支持极佳”,为芯片未来发展奠定良好基础。纵观行业历史,不乏硬件实力出众却因软件支持不足而被淘汰的案例。本次测试全程基于 Linux 主线内核完成,无需复杂的设备树(Device Trees)或定制驱动补丁。
尽管英伟达 Vera 相较当前一代芯片实力强劲,但 AMD、英特尔的新一代产品已在路上,性能同样令人震撼。AMD 计划为霄龙 “Venice”(威尼斯)高密度版本集成约 256 个 Zen 6 核心;英特尔 “Clearwater Forest”(清水森林)则将搭载多达 288 个 Darkmont 核心,采用领先的 18A 工艺,目标直指 “每瓦性能” 冠军宝座。今年年底至明年,服务器市场格局或将迎来巨变。














评论