数字孪生:云的极限
数字孪生技术正吸引着芯片行业的广泛关注,尽管目前尚不清楚谁将拥有或管理这些技术,最佳抽象层级将是多少,以及它们将如何连接。
尽管如此,对数字孪生的投资仍在不断增加。早期版本已开始推出,芯片行业的各个领域都在进行试验,一方面探索其应用方式,另一方面避免被新的或现有的竞争对手甩在身后。如果数字孪生能够兑现其承诺,它将:
将可测试性设计(DFT)、良率设计(DFY)和可制造性设计(DFM)进一步向设计流程左侧前移,并向右延伸至制造环节;
建立在晶圆厂中前后向传递特定数据的机制;
集成人工智能(或智能体人工智能)中间件,融合来自不同流程的数据;
提供芯片、晶圆、封装或工艺的更庞大、更详细的 “黄金镜像”,从而更容易发现异常并进行调整。
这还只是开始。芯片行业内外众多企业的长期愿景是:从初始架构到制造零时刻提供硅前洞察,再到制造后从现场反馈至晶圆厂或封装厂。这需要处理海量数据,进而需要巨大的计算资源和存储能力。
数字孪生可大可小。它可以代表整辆车、一座城市,也可以代表子系统、芯片,甚至是多种工作负载或条件下的单个工艺过程,所有这些都在芯片或系统进入量产之前完成。
“数字孪生就像一个系统之系统,你可以将各个部分拼接在一起,” 泰瑞达(Teradyne)智能制造产品经理伊莱・罗斯(Eli Roth)表示,“它从原本 largely 孤立的仿真和模拟环境发展而来,如今正从设计到封装、测试实现全流程的数字孪生拼接。它们就像增强版的 SOLIDWORKS 模型,可融入 NVIDIA Omniverse 三维模型。真正有趣的是小芯片(chiplet)和异构集成,裸片、基板、材料、热效应以及各种可能导致昂贵失效的微小翘曲之间的耦合越来越紧密。因此,如果你能在投入这些昂贵、紧密耦合的系统之前搞清楚问题所在,那将非常有帮助。”
其他人也表示认同。“这些是颠覆性的理念,” 爱德万测试(Advantest)云解决方案高级咨询经理文森特・朱(Vincent Chu)说,“人们谈论晶圆厂工艺的数字孪生,但往往只局限于前端工艺。如果将其与后端结合 —— 因为自动测试设备(ATE)拥有器件的黄金标准 —— 那么前端工艺的仿真将更加准确。通过在数字孪生环境中跨环节前向传递数据,我们可以开发模型并进行多种假设分析,提高后端测试流程的效率。”
这可能包括多变量筛选以提高吞吐量和质量,这在多芯片组装中尤为重要。“我们正在制造人工智能芯片,这些芯片通常包含异构集成,” 朱说,“挑战在于如何在芯片组装前确保裸片的质量。这些是非常大的封装,集成了多个甚至数十个裸片。如果没有筛选出有问题的裸片,就会导致整个封装报废。”
尽管制造前的投资更高,但通过提高可靠性和更具领域 / 工作负载针对性的设计,良率提升和退货授权(RMA)减少所带来的成本节约可能非常显著。然而,协调所有环节的整合并非易事。
“当晶圆在晶圆厂进行测试时,他们不知道这些芯片将被送往何处进行封装、组装和测试,因此他们需要知道如何发送物料,这是目前尚未实现的,”PDF Solutions 首席执行官约翰・基巴利安(John Kibarian)说,“这就像一种低代码 / 无代码的方式连接主要应用系统。你需要产品生命周期管理(PLM)系统、企业资源计划(ERP)系统、制造执行系统(MES)、工程数据、制造良率数据,最终还有设计自动化信息。你需要获取这些信息,实现人机分离,让人工智能做出正确决策,这才是真正的目标。”

数字孪生的用途与益处
当前的数字孪生与未来愿景仍有很大差距。实现这一愿景需要多个步骤,首先是降低制造工艺的变异性,进而从芯片制造零时刻起提升其全生命周期的可靠性。
“测试领域的左移趋势已经持续多年,如今正达到极致,” 西门子数字工业软件汽车 IC 解决方案总监李・哈里森(Lee Harrison)说,“成为可测试性设计(DFT)工程师的同时,你也成为了功能架构师。我们使用 PCIe,有控制测试的流程,还有安全区域。因此,DFT 工程师需要完成完整的子系统架构设计,包括功能总线、嵌入式软件,并了解如何训练 PCI 和 UCIe。我们内部正在推进的一项工作是让 DFT 工程师成为功能设计师,因为在处理小芯片等更大规模的设计时,测试基础设施的控制、监控和整体设置现在通过一种小型功能域完成,而不是由器件外部的随机引脚控制。”
数字孪生也可用于测试 DFT 基础设施和结构。“我们首次在设计与验证会议(DVCon)上看到 DFT 工程师的身影,” 哈里森说,“我们可以在 ATE 上对整个测试基础设施进行预演,在流片前证明其可行性。”
这大致相当于从谷歌地球的宏观视角,深入到特定工作负载的热梯度对 2 纳米晶体管的影响。它需要连接许多以往从未结合的部分,并在不同应力下操作这些部分以获得最优或至少可行的解决方案。这在大型仿真中已经有限实现,但操作各种工艺、替换不同组件(如不同工艺节点的小芯片、不同互连或内存)的能力是全新的。
“我们可以从原子级模拟到系统级模拟,” 新思科技杰出架构师亚当・克龙(Adam Cron)说,“很多数字孪生就是仿真,在不实际构建的情况下进行操作。我们在流片前已经模拟功能模式,这都是数字孪生。如果行不通,要么不构建,要么至少知道自己在构建有问题的东西并了解原因。制造既昂贵又耗时,在启动制造前进行数字孪生模拟要快得多。”
追求更好的结果
实现数字孪生的全部潜力需要跨行业的大量协调,在某些情况下,还需要行业内多个细分领域的协作。
“我们目前处于点解决方案阶段,” 克龙说,“我们已经有了知识助手,基本已经推出。我们进入了生成式阶段,脚本也能自动生成。如果你需要特定的辅助材料,我们已经开始在工具中加入相关功能,你可以在屏幕上提问,工具会为你生成并融入你的流程。我们还开始进入智能体阶段,能够识别设计规则检查(DRC)违规,然后由工具自动修复。很快,智能体之间将实现对话,这在封闭环境中已经实现。”
数字孪生还可用于改进单个制造工艺。“它们可以帮助我们从输入和输出的测量数据中获取更大价值,帮助我们的工具表现更好,”Onto Innovation 企业软件事业部产品经理肖恩・金(Sean King)说,“通过我们的检测和计量工具,我们收集更多数据,集中整合,发现不一致之处,在一个中央平台上整合所有信息,从而了解它们的性能和相互匹配情况。你可以考虑用于预测性维护的数字孪生,确保工具正常运行。在客户端,我们的工具是他们进行质量测量和理解实际生产物料的孪生模型的输入。如果他们不信任我们工具的输出,又如何信任他们的模型?”
这里的重大挑战包括整合和组织数据,使其能够有效且高效地用于识别、预防或解决问题。“结果生成时间必须是其中一部分,” 金说,“这取决于你试图解决的问题、相关价值、是内部使用还是在其他地方的大型昂贵服务器或云中运行。你是否试图构建过于庞大、过度拟合问题的系统?这可能导致难以识别问题根源。 pinpoint 问题(如漂移发生)并采取最佳行动相对容易。但在多供应商生态系统中会发生什么?如果我们不沟通、不采用相同方式会怎样?”
解决这些差异将是一项挑战。“欧洲有一个大型汽车项目叫 CHASSIS(面向软件定义汽车的小芯片硬件架构),项目的重要部分是构建整个平台的数字孪生,让所有为系统提供小芯片的不同供应商都能虚拟接入其小芯片并查看是否可行,” 西门子的哈里森说,“所有测试基础设施是否连接并正常工作?插入整个系统后,我们能否运行所有 DFT 基础设施?你最不想看到的是,这一整套小芯片在功能上完美运行,但在 DFT 方面发现问题 —— 连接不正确,只能测试一半。所以你有了很棒的产品,但完全没用,无法放入汽车,因为只有一半可测试。”
还有连接不同类型数据的问题,这正是人工智能发挥作用的地方。“我们发现人们正在采用智能体方法,”PDF Solutions 全球晶圆厂应用解决方案经理乔恩・霍尔特(Jon Holt)说,“因此,你有遗留系统和孤立系统,每个系统通过可编程逻辑控制器(PLC)或电子设计自动化(EDA)控制器通信,另一个通过 MES 系统。你可能有产品附带的简单数据表,加载到系统中就实现了数字化。我们开始将每个系统都视为一个智能体,这样就无需传递 IP 的所有信息,只需从使用点的智能体获取所需信息。”
霍尔特表示,目标是将所有智能体的数据整合起来,并在智能体工作流中实现自动化。“这是在我们已有的遗留基础设施基础上进行构建,然后开始利用生成式人工智能(GenAI)或大语言模型(LLM)带来的能力,” 他说,“关键之一是确保数据管道的安全。无论采用何种形式,你都需要传感器以支持结果或结论所需的粒度表示物理世界。这可能是每小时对环境采样一次,也可能是射频脉冲沉积工具每毫秒采样一次。”
标准将有所帮助。国际半导体设备与材料协会(SEMI)在过去六年中一直在分享数字孪生信息,举办研讨会探讨其在制造和供应链韧性中的作用。自最初概念提出以来,变化在于云中几乎无限的计算资源可用,以及人工智能用于融合不同数据类型。这使得数字孪生能够大规模部署,或进行微小但极深的部署,并能够深入或扩展分析。
“数字孪生可以在多个层级进行模拟,” 爱德万测试的朱说,“测试单元本身可以有虚拟身份。例如,我们可以有测试仪和测试的虚拟表示。虚拟测试仪可以离线运行测试程序,并在仿真中操作历史数据日志。如果你改变条件,结果会怎样?另一个层级是器件本身。例如,我们可以有虚拟硅片,以便在流片前运行初始测试计划。如果你有测试车间其他测试仪的孪生模型,你可以基于当前自适应测试条件预测良率或吞吐量。因此,你可以构建另一个模型来模拟测试仪集群的运行,并与生产计划进行比较。流片后,真正的测试开始,但存在对器件进行调优的趋势。你可以使用 Verilog 模型模拟器件,然后运行测试程序模拟生产情况。数据可以是合成的,基于你对同系列器件的了解,有一些历史生产数据,但没有新器件的数据。”
同样的概念也可用于理解和跟踪电路老化,这对安全和关键任务应用至关重要。如果特定工作负载增加了芯片或部分芯片的利用率,与用于其他工作负载的相同芯片相比,电迁移的发生率可能在更短时间内更高。
“你可能有一个可修正的模型,显示汽车出现某种退化,” 新思科技的克龙说,“模型会表明你的性能或泄漏在特定水平下降,这是芯片本身知道的模型。然后,通过系统级的结构化寿命监测(SLM)和 DFT 技术,你可以在每次启动或关闭汽车时,或在现场每微秒验证该模型,然后预先确定该芯片是否能达到预期寿命,或不如其他芯片耐用。这将数字孪生延伸到现场,使其非常有意义。”
有了良好的数据和定义明确的数字孪生模型,这些预测可以变得更加精确。“如果你能测量,就能预测;如果你能预测,就能预防,”proteanTecs 业务发展高级总监尼尔・塞弗(Nir Sever)说,“长期测量让你了解退化速率,从而推断故障时间点。一旦做到这一点,你就可以预测并提前发送警报,因为你不想等到最后一刻。”
通过正确的模型和数据,这可以实时实现。“如果你有 100% 测试覆盖率的工作负载,并在绝对最大工作负载下对器件进行可靠性测试,假设模型正确,那么完好的器件不应提前失效,” 塞弗说,“但这里有太多假设。实际上,你可以测试模型的准确性,因此应该在测试上投入更多。但你无法避免生命周期监测,以便在错误导致问题前检测到正在发生或出现的错误。”
哈里森表示,数字孪生还可用于确定片上监控器是否真正检测到异常性能退化。“如果我在芯片上添加所有这些监控器,它真的能给我有用的信息吗?数字孪生可以做的一件事是对试图检测的某些效应进行建模。你可以对某些退化形式和过电压进行建模。在安全方面,我们正在考虑使用数字孪生来模拟可以进行的侧信道攻击。在实际投入流片前尝试各种方案真的很棒。”
展望未来与回顾
数字孪生的应用可能性几乎是无限的,这就是为什么近十年来它一直受到行业关注。这种数据融合也有助于解释为什么去年 PDF Solutions 收购了 secureWise,新思科技收购了 Ansys。企业正在为这一技术的下一阶段布局,并投入大量资金实现目标。
变化在于,足够多的技术组件已经就位 —— 足够的计算资源、数据管理和挖掘工具以及人工智能 / 机器学习基础设施 —— 数字孪生终于可以开始以有意义的方式应用。
“想象一下你有一个退货授权(RMA),” 泰瑞达的罗斯说,“这里有一批不良器件。发生了什么?三个月前它们在生产中经历了什么。你可以查看所有生产数据、描述它们的测试结果以及流程中实际发生的情况。我的流程非常复杂。我烧录了什么,没烧录什么?我是如何做出这些决定的?处理 RMA 的人不是构建测试的测试工程师,他试图弄清楚测试中发生了什么。这些测试程序庞大而复杂,可能有 20 或 30 人参与,让他们了解其中的情况就像解谜。但如果我能获取该器件、库存单位(SKU)、所需特征,就可以在虚拟环境中重新运行并调试。这将非常棒。”
在从设计到制造的任何流程中,更快速地筛选数据并以独特方式应用的能力是一大飞跃。“你希望从晶圆厂制造流程的前端向后端前向传递数据,因为如果你想微调前端处理,就需要参考后端性能,” 爱德万测试的朱说,“这取决于你的模型有多全面。你可以在前端有非常全面的孪生模型,也可以在后端有孪生模型。然后让数据在所有阶段跨前端和后端流动,进行模拟。”
如今,大部分工作仍处于早期阶段,仍有许多挑战需要解决。但改进流程、提升系统可靠性和降低多层次成本的可能性非常真实且显著。



评论