热管理不断发展以应对人工智能高能耗需求
长期以来,热管理一直是设计工程师面临的关键挑战。几十年来,工程师们一直面临着试图从密集的电子设备中散热的问题,这些电子设备在增加更多功能的同时不断缩小尺寸。现在,庞大的数据中心也加入了其中,其中一些运行人工智能服务器,配备功能强大、热运行的 GPU 和 CPU。
无论大小,工程师都发现他们必须在空间和性能方面进行权衡,以达到可接受的冷却水平并防止敏感电子设备过热。幸运的是,仿真和分析工具的出现使工程师能够在设计周期的早期,甚至在组装原型之前,将热管理设计到电子产品或系统中。
多年来,风扇和散热器一直被用来冷却电子产品。但它们的冷却能力不足以应对 AI 处理器的更高功耗。
“随着人工智能工作负载推高功率密度,散热器和风扇等传统冷却方法正在达到极限,”Rambus 研究员兼杰出发明家 Steven Woo 说。“这些方法很难有效地从密集封装的高性能芯片中去除热量,从而导致热瓶颈,从而限制性能并降低可靠性。”
液体的优缺点
处理数据中心巨大冷却问题的一种方法是使用液体冷却,这带来了一系列问题。“液体冷却提供了卓越的热性能,但它给系统设计带来了复杂性,”Rambus 的 Steven Woo 说。“对泵、管道和冷却剂分配基础设施的需求增加了空间需求,并可能使维护复杂化,尤其是在改造或空间受限的数据中心。然而,鉴于人工智能的巨大价值创造潜力,以及为人工智能提供动力所需的快速增长的电力需求,尽管复杂性增加,但液体冷却的采用率将越来越高。
例如,英伟达开发了机架级液冷系统,旨在处理万亿参数大型语言模型推理的艰巨任务。据该公司称,冷却系统架构针对测试时扩展精度和性能进行了优化,使其成为运行人工智能推理模型同时有效管理能源成本和热量的理想选择。
风机和鼓风机不断发展
电子应用中使用的传统风扇和鼓风机虽然存在噪音和占用空间等缺点,但仍然是一种久经考验的冷却方法。
根据 Verified Market Reports 上的一篇博客文章,风机和鼓风机受益于智能和物联网技术的结合,这些技术允许它们进行远程控制并优化能源效率。该博文还指出,可以使用更多能够在高温下运行的高温风扇。而且,改进的叶片设计、隔音材料和减振技术等功能有助于降低风扇噪音水平。
与多年来的情况一样,风扇有轴流和离心两种配置。轴流风机平行于风扇轴线移动空气,其叶片在旋转时产生压差来产生气流。离心风机,也称为电动叶轮或径向鼓风机,垂直于风机轴线移动空气。它们的旋转动作将空气吸入风扇的中心,然后通过管道或外壳将其向外推。
轴流风机往往在计算机和服务器等电子应用中更为普遍,而离心风机往往进入暖通空调和工业应用。
也不要放弃散热器
另一种长期冷却选择,即散热器,也仍然是一个可行的选择。在某些情况下,散热器受益于制造和设计的进步。“增材制造通过解锁复杂的几何形状(如晶格结构和内部微通道(如 3DEO 的纯铜散热器)将热性能提升到新的水平,”首席运营官 Rajan Ramaswamy 说。据该公司称。这种方法可以实现更好的设计调整、更轻的组件和传统制造无法实现的性能。
散热器(照片)由纯铜制成,据报道,纯铜具有无与伦比的导电特性,对下一代电力电子、半导体冷却、射频系统和储能至关重要。3DEO 的智能分层技术能够生产具有机械稳定性的全致密、高精度铜部件。据该公司称,散热器采用复杂的几何形状,如晶格结构和内部微通道,以更好地设计调整、更轻的组件和传统制造无法实现的性能。
“我们将 DfAM(增材制造设计)与热建模相结合,以快速迭代和优化铜散热器等设计,”Ramaswamy 说。这使客户能够共同设计符合其特定系统要求的先进散热解决方案。
稳压器
工程师们还试图通过在发热芯片附近放置稳压器来优化芯片设计,以改善散热。
Empower Semiconductor全球营销和欧洲、中东和非洲地区销售高级总监Eric Pittana表示:“直接在芯片上或芯片附近集成电压调节可以显着降低功率损耗,改善瞬态响应,并最大限度地减少寄生效应,这对于高带宽AI和HPC工作负载尤其重要。
Empower 提供垂直供电技术,将供电稳压器放置在处理器正下方的 SoC 下方位置,能够移动到接近并最终在封装中进行功率转换。“这种方法消除了高达 20% 的高电流横向配电损耗:在 1000V 供电的典型 54W 数据中心机架式服务器上,这相当于系统效率提高了 5%,”Pittana 说。“更高效的配电意味着更少的冷却要求和复杂性。”
Empower 最近与 Marvell Semiconductor 合作,展示用于冷却下一代 AI 处理器的 Crescendo 技术。
片上冷却风扇也在一些冷却应用中得到了更仔细的研究。一个例子是 AR/VR 耳机和眼镜,它们紧密包装的电子设备提出了令人生畏的冷却要求。
“AR/VR 眼镜带来了产品设计挑战,”xMEMS 营销和业务发展副总裁 Mike Housholder 说,该公司开发了包括微型音频扬声器在内的非常小的电子设备。更多的计算和其他电子设备正在被纳入其中。
利用其压电MEMS技术,xMEMS开发了一种版本的μCooling片上风扇解决方案,以适应VR眼镜的框架。风扇尺寸小至 9.3 x 7.6 x 1.13 毫米,使用超声波频率产生气流和气压。据 Householder 称,μCooling 片上风扇目前正在向客户提供样品。
不过,并非所有公司都同意片上冷却的好处。
Empower Semiconductor 的 Eric Pittana 表示:“然而,片上冷却风扇提供的好处有限;虽然新颖,但它们在规模上的影响有限,似乎微不足道,并增加了复杂性和可靠性风险。我们相信,一条更具可扩展性的道路是共同设计电源和热解决方案,以全面解决电源和热问题。
模拟的作用
无论选择哪种冷却方法,实现所需最佳冷却量的关键是准确计算散热,而散热又取决于存在的电子元件、它们在开启和关闭状态下的性能,以及印刷电路板和外壳等机械因素。为了准确计算所需的冷却量,设计工程师越来越多地求助于计算机辅助仿真和热分析工具。
MathWorks 的 Simscape 系列建模工具中可以找到这样一套热分析工具。Simscape 使设计工程师能够对包括电机、执行器、制冷系统和其他组件在内的物理系统进行建模,并考虑电气和热特性的影响。
“无论您是被动冷却、主动冷却、使用空气还是液体,都可以在模拟中考虑,”MathWorks 顾问产品经理 Graham Dudgeon 说。Dudgeon 补充说,模拟电气特性的能力也会影响热特性,例如,无论半导体是打开还是关闭,传导和开关损耗都会受到影响。
MathWorks 提供了一个用于对设计物理属性进行建模的仿真平台,称为 SimScape,该平台考虑了热和电气特性等因素。
Ansys半导体分析产品产品营销经理Marc Swinnen补充道,热建模的重要性不容小觑,因为热问题还与产品设计中的其他物理问题有关,包括电气特性、屏蔽和机械问题。
“在电子系统中节省电力的最佳方法是降低电压。但这样你就会带来电压下降的风险,“Swinnen 说。他补充说,随着系统设计继续倾向于更高的频率,降低电压也具有挑战性。
Swinnen 指出,该公司的多物理场仿真和分析工具旨在对系统的热特性进行建模,考虑电气和机械行为的动态变化。
评论