Supermicro推出适用于NVIDIA Omniverse的即插即用SuperCluster
Supermicro机架解决方案能在单一可扩展单元内配置最多256个最先进的NVIDIA PCIe GPU,可最大化3D与AI工作负载性能,并针对NVIDIA Omniverse大规模部署优化
本文引用地址:https://www.eepw.com.cn/article/202408/461727.htmSupermicro, Inc. 作为AI、云端、存储和5G/边缘领域的全方位 IT 解决方案制造商,宣布推出可搭配NVIDIA Omniverse™平台的全新SuperCluster,扩增其SuperCluster即插即用AI基础架构解决方案组合,并能提供企业级的高效生成式AI强化型3D工作流程。此新型SuperCluster配置了最新Supermicro NVIDIA OVX™系统,并能让企业在工作负载增加时轻松扩增规模。
Supermicro总裁兼首席执行官梁见后表示:“Supermicro在开发GPU优化产品方面领先业界,而这些产品可用于传统的3D图形与应用程序加速,以及目前的AI技术中。随着AI技术的兴起,企业纷纷寻求一种计算基础架构,能将上述所有处理功能整合至单一套件内。Supermicro的SuperCluster配置了完全互连的4U PCIe GPU NVIDIA认证系统(NVIDIA-Certified Systems™),针对NVIDIA Omniverse而设计,且每个可扩展单元最多可搭载256个NVIDIA L40S PCIe GPU。该系统可帮助生成式AI整合平台Omniverse提升性能。我们针对Omniverse开发此款SuperCluster,提供的不仅是产品,也打开了通往未来应用开发和创新的大门。”
这款适用于NVIDIA Omniverse的SuperCluster 扩大了Supermicro应用优化 AI 机架解决方案阵容。从产品设计到工业数字分身领域,许多专业人士都仰赖高度密集计算的3D工作流程。生成式AI强化了目前的3D 工作流程,并推动着它在新时代的应用。同时,这款适用于NVIDIA Omniverse的SuperCluster有助于简化横向扩展基础架构的部署,进而满足3D和AI的多重工作负载需求。
Supermicro NVIDIA OVX系统是集群计算能力的基础建构组件。每个系统节点最多可容纳8个最新的NVIDIA PCIe GPU,提供3D图形和虚拟现实的最高性能组合,并在Tensor Core和Transformer Engine的支持下实现卓越的生成式AI性能。这些系统由4个2700W钛金级电源供应器供电,而这些电源供应器全部安装于高气流式机箱内,以确保它在高使用率状态下依然稳定。每个系统配置最多4个NVIDIA BlueField®-3 SuperNIC或4个NVIDIA ConnectX®-7 NIC,可提供多个400Gb/s网络端口,具有高度扩展性和安全性。
Supermicro的4U PCIe GPU系统已获得NVIDIA认证,可搭配NVIDIA Omniverse使用,已通过严格的性能、可靠性、可扩展性和安全性测试验证流程。企业可以在NVIDIA Omniverse开发平台内最大化不同类型工作负载的性能,其中也包括通过Omniverse Cloud API来建构虚拟世界的OpenUSD生态系统和生成式AI技术。
适用于NVIDIA Omniverse的SuperCluster是一款完全互连的基础架构解决方案,帮助开发者、艺术家、工程师等人群在需要时获得最高等级的GPU计算能力,无缝存取虚拟GPU或裸机存取整个系统节点。由NVIDIA Spectrum™-X以太网络平台提供的400Gb/s高性能网络结构,使开发定制化大型语言模型的企业能够存取并应用跨系统节点的GPU内存组合集区,这对于大型AI模型的训练至关重要。
Supermicro经过验证的机架解决方案包括了从4个GPU到单组搭载256个GPU的可扩展单元,能通过单元扩增的方式适应不同类型和规模的企业。即插即用的机架已经过L12 等级测试完整验证,客户在收到机架的第一天即可部署使用。
从单个机架到企业级规模的高度定制化解决方案
适用于NVIDIA Omniverse的Supermicro SuperCluster可根据客户要求,部署不同的机型选项和尺寸。系统节点的每组系统可配置4个或8个GPU ,可选择由4个系统组成的单一机架,到搭载 32 个系统的5 组机架式可扩展单元。大型部署则能通过可扩展单元的增量,实现任意规模的集群建置。
由NVIDIA Omniverse可扩展单元所组成的SuperCluster包含:
● 32个Supermicro SYS-421GE-TNRT(Dual-Root)或SYS-421GE-TNRT3(Direct-connect) PCIe GPU系统节点
● 256或128个NVIDIA L40S GPU
● 3个Supermicro SYS-121H-TNR Hyper System控制节点
● 3个400G 64端口NVIDIA Spectrum™ SN5600以太网络计算结构交换器
● 2个400G 64端口NVIDIA Spectrum SN5600以太网络存储/控制结构交换器
● 2个1G 48端口NVIDIA Spectrum SN2201以太网络管理交换器
● NN NVIDIA BlueField-3 SuperNIC或NVIDIA ConnectX-7 NIC
● 5个机架:48U 750mm x 1200mm
适用于NVIDIA Omniverse的SuperCluster部署规模最小可为单一机架。机架配置包含:
● 4个Supermicro SYS-421GE-TNRT或SYS-421GE-TNRT3 PCIe GPU系统节点
● 16或8个NVIDIA L40S GPU
● 2个Supermicro SYS-121H-TNR Hyper System控制节点
● 1个400G 64端口NVIDIA Spectrum SN5600以太网络计算结构交换器
● 1个400G 64端口NVIDIA Spectrum SN5600以太网络存储/控制结构交换器
● 1个1G 48端口NVIDIA Spectrum SN2201以太网络管理交换器
● NN NVIDIA BlueField-3 SuperNIC或NVIDIA ConnectX-7 NIC
● 1个机架:48U 750mm x 1200mm
评论