"); //-->
近日,全球倍受瞩目的权威AI基准测试MLPerf公布今年的推理测试榜单,其中浪潮AI服务器NF5488A5一举创造18项性能纪录,在数据中心AI推理性能上遥遥领先其他厂商产品。
MLPerf是当前全球最具影响力的AI计算基准评测组织,由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、斯坦福、哈佛大学等单位共同成立,每年组织全球AI训练和AI推理性能测试并发榜。据了解,此次MLPerf的AI推理基准测试有全球23家公司和单位参与,在数据中心及边缘等场景进行AI计算产品的性能比试。今年MLPerf训练榜单已于7月公布。
浪潮NF5488A5获数据中心AI性能绝对优势
此次浪潮NF5488A5一举创造18项MLPerf推理性能纪录,成为创纪录最多的AI服务器。今年的测试中,数据中心AI性能最受关注,全部参与机构提交了507项性能测试数据。
浪潮NF5488A5创下了数据中心22个赛项中的13项性能纪录以绝对优势领先,NVIDIA DGX取得了5项数据中心性能纪录。而在此前的MLPerf训练榜单中,NF5488A5在最核心的Resnet50训练任务中也创下了性能纪录,单机性能高居榜首。

浪潮NF5488A5创造18项MLPerf推理性能纪录
性能大幅提升3倍,全栈AI能力优势凸显
在此次基准测试中,浪潮AI服务器NF5488A5在开放优化(Open)和固定任务(Closed)的ResNet50基准性能测试中,均表现优异,相比2019年MLPerf推理榜单的服务器最好性能提升高达3倍。

MLPerf ResNet50推理性能2019 VS 2020对比
NF5488A5是浪潮自研的新一代AI服务器,是此次MLPerf全球竞赛中唯一可以在4U空间内支持8块安培架构A100芯片实现NVLink高速互联的AI服务器。浪潮NF5488A5在系统拓扑上采用了超低延迟设计,支持PCIe 4.0全链路极致优化,高频通信单元采用一级拓扑最近连接,最大限度提升处理器到AI芯片间的通信性能。同时,通过配置NUMA节点,确保每颗处理器与其直连的GPU之间通信性能最优,最大限度降低通信延迟。此外,NF5488A5通过深度优化系统结构设计,确保设备可在高温环境下稳定运行。
本次基准测试中,浪潮展示了其AI计算软硬件协同优化的强大实力。在硬件层面,通过对CPU、GPU硬件性能的精细校准和全面优化,使CPU性能、GPU性能、CPU与GPU之间的数据通路均处于对AI推理最优状态;在软件层面,结合GPU硬件拓扑对多GPU的轮询调度优化使单卡至多卡性能达到了近似线性扩展;在深度学习算法层面,结合GPU Tensor Core 单元的计算特征,通过自研通道压缩算法成功实现了模型的极致性能优化,在精度无损的情况下性能提升近2倍。

各服务器MLPerf AI推理性能对比(以浪潮NF5488A5为基准,越高越好)
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
宇树科技确认:近期已完成C轮融资交割
AI需求回升 SSD厂Q2拼返成长
Re: 请问一下ACEX1k -3的Global Clock能到多快
两个VHDL写的51内核
X-FAB 扩展 180nm 工艺,推出新的 SPAD 隔离类别
由CD4511组成的循环式定时提醒器电路
多元入局,加速技术与商用化进展—IDC发布人形机器人市场分析
由NE555、CD4017构成的电话通话计时提醒器
罗德与施瓦茨公司最新示波器产品演示
中国比特币挖矿机制造商正将生产转移到美国以规避关税和制裁
UMC 据报计划在南台湾设厂,以扩展超越新加坡的先进封装业务
由CD4541构成的定时服药提醒器
请教各位大侠:
求救:关于ALTERA EPLD
量程自动转换电压表
据报道,微软下月将裁员数千人
Altera的EPM7064SLC84-10求助
利用单片机的端口地址实现对液晶显示器的控制
由CD4541组成的电扇模拟自然风控制电路
基于新技术电源控制IC的绿色高效 高功率密度电源的设计
赛灵思全新7系列FPGA
模拟比较器的应用
据报道三星 1c DRAM 良率高达 70%,为年底推出 HBM4 铺平道路
赛灵思全新7系列FPGA产品实验室测试
Re: LCELL的延时有多大,大虾请出手!
模糊逻辑c语言自动生成器
LinkSwitch-PH与LinkSwitch-PL可为LED照明提供最优化解决方案
SK 海力士据报与英伟达、微软合作推动定制 HBM4E,三星则与 HBM4 保持差距
特朗普的 AI 顾问:中国在芯片设计方面最多落后美国两年
用CD4541组成的长延时定时电路