英特尔宣布实现 MLPerf Client 0.6 基准测试首个全 NPU 支持
5 月 7 日消息,当地时间 5 月 5 日,英特尔宣布成为唯一在 MLPerf Client v0.6 基准测试中实现全 NPU 支持的企业。
本文引用地址:https://www.eepw.com.cn/article/202505/470141.htm英特尔表示,该结果标志着行业首个针对客户端 NPU 的大语言模型(LLM)性能标准化评估。测试数据显示,英特尔酷睿 Ultra 200 处理器在 GPU 和 NPU 上的输出速度远超人类平均阅读速度。
英特尔客户端 PC 产品营销副总裁兼总经理丹尼尔・罗杰斯(Daniel Rogers)表示,“我们很荣幸能够引领行业,实现客户端 PC 平台的全 NPU 加速和领先 GPU 性能。”
测试配置
AMD英特尔平台华硕 Zenbook S 16华硕 Zenbook S 14型号UM5606WAUX5406SACPUAMD 锐龙 AI HX 370酷睿 Ultra 9 288VBIOS 日期2025 年 3 月 21 日2025 年 2 月 26 日BIOS 版本UM5606WA.317UX5406SA.306内存32GB LPDDR5,7500MHz32GB LPDDR5,8533 MHz显卡AMD Radeon 890M英特尔 Arc 140V存储1TB1TB操作系统Windows 11 专业版 x64
英特尔表示,在基于 Llama 2 7B 模型的四项内容生成与摘要测试中,英特尔在 NPU 和内置 Arc GPU 上均展现领先性能:
· 创 NPU 最快响应速度,首个词元生成仅需 1.09 秒(首 token 延迟)
· 实现 NPU 最高吞吐量 18.55 tokens / 秒
· GPU 首 token 生成速度超越竞品
MLPerf Client 由 MLCommons 联盟成员(含英特尔、AMD、微软、英伟达、高通)联合开发,首次突破以 GPU 为核心的测试模式,新增专用 NPU 基准评估。
评论