芯片供电,越来越复杂了
IR 压降正成为越来越多设计中日益棘手的问题,这表明供电网络(PDN)未能在需要时为设计的某些部分提供足够的电流。不幸的是,这个问题没有简单的解决办法。
过去,当电压高得多时,微小的电压下降并不重要。与此同时,导线也粗得多,电阻更低。最后,开关速度较慢,产生的电流尖峰也较小。然而,在近期的技术节点上,所有这些情况都变得更糟,结果是越来越多的设计出现了时序问题。
「这曾经是一个次要问题,」现隶属于新思科技的 Ansys 产品营销经理 Marc Swinnen 说。「现在你面临的是,非常快速、巨大的电流尖峰要通过非常细的导线,而对任何电压降的容忍度都非常低。增加设计裕量(Margining)曾经是简单的出路,但在空间和性能上,增加裕量的代价都非常高昂。」
为了解决这个问题,需要更多地关注供电网络的设计。「在进行布局布线之前,你并不知道逻辑门会被放在哪里,而且它们也并非完全相同,」西门子数字工业软件的产品管理高级总监 Joe Davis 说。
因此,供电网络的设计需要在所有细节都确定之前开始。「基本的架构是在单元行周围设置一个电源环,然后单元行从边缘接入环网,」Ansys 的 Swinnen 解释说。「随着电流沿着单元行流动,电压会下降。在行的中间,你会遇到最深的压降。为了支持电压,你需要在环网上拉伸电源带(power straps)。从环的顶部到底部拉伸一条带,在它穿过的每一行,你都通过一个过孔连接到本地电源轨以支撑它。这样就形成了一个网状结构。电源带的数量越多,间距越密,电压供应就越好。」
热问题与背面供电
如果导线的电阻更高,还会产生第二个问题。「IR 压降的问题在于热,」Empower Semiconductor 的客户应用工程总监 Luca Vassalli 说。「如果有电流流过那个电阻,就会产生功率。它产生的功率与电流的平方成正比。随着电流的增加,降低那个电阻变得非常重要。如今的处理器,其核心拉动的电流高达 1000 安培。如果你有 1000 安培流过 100 微欧姆,那就损失了 100 瓦。而 100 瓦可能是一个处理器功率的 10%。」
业界正尝试通过将电源线移到裸片的背面来解决这个问题。「这个概念是把又大又粗的电源线移开,」西门子的 Davis 说。「这确实有帮助,但又产生了另一个问题。不是时序问题,而是热问题。电源线移开后,你可以塞进更多的东西,器件可以靠得更近。你可以让它们运行得更快,但当这种情况发生时,它们会变得更热。导线的可靠性会因热量而呈指数级下降,所以温度越高,电阻越高,IR 压降越大,可靠性越低。」
层级化问题
芯片工程师关注的是裸片上的走线,但该裸片可能位于一个中介层上,在封装内,在一个系统中的一块电路板上,而主电源就在那里。这就产生了一条长路径,需要被理解。「在芯片、封装、电路板这个问题上,我们看到了很多问题,」弗劳恩霍夫集成电路研究所(Fraunhofer IIS)高效电子部门主管 Andy Heinig 说。「没有人能真正回答如何对芯片、封装、电路板进行供电验证的问题。这真的是一个未解决的问题。」
目标是在需要的时候,以最少的损耗将能量输送到需要的地方。「我们发现最好的折衷方案是把电压调节器放在封装外,但尽可能靠近封装,因此放在 PCB 的背面。要真正实现封装内的集成,还需要另一层级的改进,但关于集成电压调节器(IVR)进入封装的讨论很多,」Empower 的 Vassalli 说。
在封装内部,许多最大的设计将包括一个中介层。「中介层更宽松,」Swinnen 说。「它通常是像 16 纳米或 35 纳米这样的技术,但你需要传输更大的功率。在中介层上,并通过微凸点,你不仅需要为这个芯片供电,可能还需要为它上面的芯片供电。它必须通过硅通孔(TSV)和这些微小的凸点来馈电。数百瓦的功率必须通过这些微小的连接传输。这更复杂,也不同。有新的因素加入进来,但同样的问题也适用。」
安全可靠性与汽车行业的挑战
当涉及到安全性和可靠性时,这些问题变得更大。「由于功能安全的要求,我们在汽车领域遇到了问题,而这些要求完全不清楚,」弗劳恩霍夫的 Heinig 说。「你在功能性方面为功能安全付出了如此多的努力,然后我们在供电网络上又有很多不确定性。我们有来自供电网络的单点故障。」
汽车行业在这个领域面临许多问题。「汽车行业正开始向先进节点迈进,他们面临一个问题,因为如果他们遵循所有的代工厂规则,他们就无法设计出有竞争力的芯片,」Davis 说。「没有解决方案空间,所以他们正在审视代工厂使用的电迁移规则的严格性。今天使用的规则是建立在布莱克方程(Black's equations)上的,但那些方程忽略了它是一个网络的事实。它是一个供电网络。只有在少数地方,我只有一条路径向一个逻辑门供电。如果一部分电阻有小幅增加,那部分电力将通过另一条路径传输。一个真正基于物理的可靠性分析表明,布莱克方程和当前的模型不仅给出悲观的结果,在许多情况下还给出完全错误的结果。」
模型与仿真
为了进行任何形式的分析,都需要模型。「EMIR(电迁移与 IR 压降)中的一切都是一个近似游戏,因为最终,要获得最准确的答案,我们需要对整个芯片及其寄生效应进行完整的电气仿真,」Davis 说。「这可能是整个过程中成本最高的一步。你必须为早期分析对其进行近似。而那些模型是基于他们在设计、架构和分区的历史经验建立的。」
早期分析可以省去很多麻烦。「早期分析在缓解与供电网络相关的风险方面起着关键作用,影响着分区、布局规划和电源网格拓扑等架构决策,」Ansys 的 Takeo Tomine 说。「这些可以避免代价高昂的后期重新设计。通过在布局最终确定前尽早纳入电源完整性检查,设计者可以主动识别易受 IR 压降影响的区域,并相应调整块的放置、布线通道和去耦电容的分配。」
后期检测到的问题可能代价高昂。「IR 压降分析的难点之一就是它很难修复,因为当你检测到并分析它时,你已经在流程中走得太远了,你的时序已经平衡好了,你真的不想为了修复 IR 压降而开始弄乱你的设计。你需要在设计的早期,在布局阶段就进行良好的 IR 压降分析,那时你仍然可以轻松地修改布局,」Swinnen 说。
结论
没有一个稳健的供电网络,现代设计将会有显著的 IR 压降问题。与此同时,设计中越来越多的路径正变得关键,这意味着如果-没有进行深入的分析,芯片将无法在目标频率下运行,或者干脆失效。
行业尚未开发出既能满足所有签核需求,又能使用一致的模型和场景进行早期分析的方法。为满足这些需求,正有更多的投资投入,而这一切始于回归基础物理学。有了这个坚实的基础,更好的解决方案才可能实现。


评论