集成内置遥测功能的芯片助力AI分析
如何判断芯片是否正常运行?能否预测它何时会失效或为何失效?
判断芯片的运行状态涉及诸多变量,这不仅仅取决于某项计算结果或芯片当前对电机的控制效果。人工智能与机器学习(AI/ML)已被用于监测电机的健康状态,但芯片自身的健康状况该如何监测?这需要另一套传感器。proteanTecs 的解决方案正是通过芯片内置支持,提供可供 AI 分析的状态信息。proteanTecs 的芯片内置传感器提供数据,结合 AI 模型可检测现有或潜在问题。

ProteanTecs公司解决方案工程副总裁Noam Brousard讨论了该公司的芯片内置遥测解决方案。
开发者通常利用 JTAG 进行调试,而 Arm 的嵌入式跟踪宏单元(ETM)等事件跟踪功能可提供有关计算过程的信息。但这些工具通常缺乏芯片温度等细节,而这类信息对全面评估芯片健康状态至关重要。Arm 的性能监控单元(PMU)也主要针对计算单元,而计算单元只是系统的一部分。
proteanTecs 的方案与之类似,通过在芯片设计中集成名为 “Agents” 的额外 IP 实现功能,但它专注于捕捉能反映芯片健康状态的各类细节。这些信息的获取方式与 JTAG、ETM 或 PMU 数据类似,可上传至云端进行分析。基于这些数据训练的 AI 模型能够检测潜在问题、缺陷或未来可能发生的故障。
proteanTecs 的 Agents 能检测时序故障等问题。这类故障可能由外部条件导致的时钟速度加快或温度升高引起。

芯片设计中可集成十多种标准 Agents,它们通过 proteanTecs 的网络和支持逻辑相连,实现采集数据的分析与输出。











评论