四大核心要素驱动汽车智能化创新与相关芯片竞争格局
智能汽车时代的加速到来,使车载智能系统面临前所未有的算力需求。随着越来越多车型引入电子电气架构转向中心化、智能驾驶的多传感器融合、智能座舱的多模态交互以及生成式AI驱动的虚拟助手等创新技术,都要求车用主芯片能够同时胜任图形渲染、AI推理和安全计算等多重任务。当下,功能安全、高效高灵活性的算力、产品生命周期,以及软件生态兼容性这“四大核心要素”,已成为衡量智能汽车AI芯片创新力和市场竞争力的核心标准。
传统汽车计算架构中,往往采用CPU与GPU或/和NPU等计算单元组成异构计算模式;随着自动驾驶算法从L1向L5快速演进对软件适配性的要求越来越高,以及不断有新的传感器和信息娱乐设备加入车内,不同的架构开始出现不同的发展轨迹。同时,系统复杂性快速提升、大量的数据搬运、资源调度协同难度提升和软件快速迭代等新挑战开始出现,使缺乏灵活性的硬件架构成为了在技术、安全和成本等多个方面制约汽车智能化发展的瓶颈。
市场急需一种既能灵活地提供高性能、高效图形与AI加速能力,同时满足功能安全标准、可与广泛的软件生态对接且总成本更低的车用芯片架构。
功能安全不仅关乎安全也是芯片成本控制关键
功能安全永远是消费者、主机厂、Tier-1和芯片供应商首先关心的问题,但它并不是一个智能驾驶技术快速发展进程中才出现的问题;行业已经形成了完善的ISO26262标准和ASIL认证体系,以及锁步(Lock-Step)和双套硬件结果对比等解决方案。但是随着车用芯片中的CPU、GPU和NPU越来越复杂并占用更大面积,这些原本为MCU提供的功能安全解决方案的硅成本和复杂性都大幅提升,因此市场需要在汽车芯片功能安全解决方案领域实现创新。
作为汽车电子领域的一项创新产品,Imagination DXS GPU IP专注于智能座舱与自动驾驶场景的深度优化,其设计充分体现了业界近期在功能安全方面的巨大突破,同时确保了性能的提升、安全性的增强以及芯片成本的有效控制。Imagination DXS GPU的峰值性能较前一代产品提升了50%,算力从单核的0.25TFLOPS扩展至1.5TFLOPS,最高可达6TFLOPS和24TOPS,同时支持高达192GPixel/s的图形渲染速率。
在功能安全的实现上,Imagination DXS GPU采用了针对GPU运算开放的分布式安全机制(DSM),仅以10%的面积开销就实现了ISO 26262 ASIL-B功能安全认证。DSM利用了处理器的并行特性,在空闲周期运行安全测试,既保证了性能不受影响,又确保了安全,打破了锁步和备份等传统安全设计的局限性。这一创新设计从架构层面阐释了功能安全领域仍然存在着许多创新机会,可以帮助越来越先进的GPU在安全保障、系统复杂性、成本控制与下游厂商获得认证等多个方面创造价值。
正是因为Imagination DXS GPU在功能安全性和计算性能等方面实现了开创性的突破,在2025年5月于上海举办的 “第十二届汽车电子创新大会暨汽车芯片产业生态发展论坛(AEIF 2025)”上,Imagination DXS GPU IP凭借其创新的、先进的GPU技术,荣获“2025 汽车电子・金芯奖-新锐产品”殊荣。据了解,从该公司的D系列GPU IP产品开始,包括最新的公布了架构的E系列中的车用GPU IP都将采用这种成本和复杂性都具有明显优势的分布式功能安全机制。目前,DXS GPU IP已集成于瑞萨R-Car Gen 5系列SoC中,助力智能驾驶技术的商业应用,满足从入门级到旗舰车型的全方位需求。
高灵活性的高效算力是车用处理器的核心功能
对于车用芯片设计企业,为了处理越来越复杂的AI计算和图形渲染,在其计算芯片中采用GPU或者NPU这样的并行处理器成为了必然;然而随着汽车电子电气架构从域控制转向中央控制,车用核心处理器不仅需要更高的算力,而且还需要针对不同的应用可以在架构上灵活地进行优化,也就是需要性能更高、同时又不会被锁死在NPU或者GPU架构上的灵活架构,这也成了汽车和其他很多边缘AI应用中高性能并行计算的发展方向。
对于这种可以针对应用进行优化和定义的并行计算处理器架构,依然是Imagination凭借其技术前瞻性和能力,而重新定义了面向汽车和端侧AI的高性能并行计算行业标准。2025年5月,Imagination推出了专为端侧智能场景设计的新一代E系列(E-Series) GPU IP架构,该系列GPU凭借其高效的并行处理架构,在提供卓越图形性能的同时,针对人工智能工作负载具备灵活算力扩展能力。
E系列GPU架构集成了神经核(Neural Cores)和爆发式处理器(Burst Processors),支持算力从2TOPS灵活扩展至200TOPS(INT8/FP8),满足从基础端侧计算到高阶智驾的多样化算力需求。这样的架构设计使Imagination E系列GPU同时具有了NPU的高性能和GPU的高灵活性;通过优化指令调度和数据复用机制,端侧计算的平均功耗效率提升了 35%,在相同算力条件下,车载系统的功耗降低了20%。
这种高效且灵活的AI算力及图形处理功能调配,完美贴合了在包括汽车在内的端侧AI场景中同时存在大量的AI计算与图形处理需求的应用,优化了中央计算模式下核心车用芯片同时处理驾驶和座舱需求的性能与能耗。此外,通过升级硬件级虚拟化技术,E系列GPU IP支持多达16个虚拟机任务隔离,实现了AI、图形、UI等多任务的异步并行处理,确保了智能座舱多系统协同工作和自动驾驶多任务并行处理的车用场景需求。以“高灵活性的高效算力”为核心,E-Series GPU不仅满足了未来智能汽车车用处理器的算力需求,并推动了汽车智能化体验的进一步提升。
更长的产品生命周期:GPU架构的可编程性打破总成本困局
随着智能驾驶和智能座舱技术从旗舰车型向中低端车型的渗透,主机厂对芯片成本的严格控制正在推动行业打破传统开发模式的局限性。根据行业数据,传统车用计算芯片的开发成本高达2亿-3亿美元,研发周期长达3~5年。在算法需要迭代时,固定功能架构的NPU芯片必须重新流片,每次迭代的成本占到初始开发费用的40%~50%。这种“高投入、长周期、低弹性”的开发模式,在主机厂追求“一款芯片满足多车型10年生命周期”的目标面前,明显暴露出成本上的限制。
因此,相对于从架构到功能都基本固定的基于NPU车用控制芯片,采用GPU IP的车用芯片可以更加从容地去面对这样的总成本压力,因为采用GPU的硬件设计可以通过更高的可编程性来实现跨算法、跨厂商和跨车型应用,用更大数量的市场应用来摊低高昂的芯片研发成本,因而基于GPU架构的车用芯片比基于NPU的车用芯片拥有更长的产品生命周期和更高的应用灵活性。
当然,如果车用芯片中GPU本身的AI计算与图形处理能力就可以灵活配置,那么还会带来更高的成本节省和更长的产品生命周期。以Imagination在其GPU IP产品中推动的可编程泛化架构以及由此开发的E系列GPU为例,其通过软件定义硬件的设计,可将芯片硬件生命周期延长至10年以上:当AI模型升级时,仅需数月软件适配即可完成迭代,较传统NPU迭代方案大幅减少。这种统一计算单元设计可跨汽车、工业等几大场景复用,硬件设计成本降低40%,研发投入回收周期显著缩短。
开放软件生态:一次开发、多场景部署
软件生态和可适配性正在变成各种高性能计算的重要门槛,英伟达的CUDA生态使其在AI计算和汽车芯片方面占尽了先机。因此,其他的汽车和端侧AI芯片厂商要在市场中斩获更多份额,就需要其核心计算单元IP提供商构建更加开放的软件生态;随着诸多基于此目的的标准组织不断建立和壮大,其中的主要玩家正在支持新一代车用芯片开发商解决软件生态的问题。
例如,Imagination就构建了一个面向未来的开放体系,其核心优势在于“一次开发,多场景部署”。其算力可以通过OpenCL、Vulkan等主流API直接调用,开发者利用oneAPI、Apache TVM等工具链,可以轻松地将工作负载迁移到E系列GPU中的神经核。这种可编程性不仅大幅降低了跨平台开发的成本,还赋予了设备适应未来算法变革的灵活性。面对生成式AI、多模态交互等前沿应用的快速迭代,E系列GPU无需硬件迭代,仅通过软件升级就能迅速适应,确保产品持续满足新兴需求。
在自动驾驶领域,Imagination的GPU IP同样遵循“一次开发,多场景部署”的理念。通过集成FP16流水线以及imgBLAS、imgNN等高效计算库,显著提升了雷达点云数据、视觉SLAM等传感器数据的处理速度,有效减轻了CPU和NPU的负担。同时,通过与OpenCL、Vulkan等开放标准以及CoreAVI安全驱动的兼容,确保了在复杂场景下系统的实时响应和稳定运行,使技术能力贯穿智能座舱、自动驾驶等多个场景,巩固了跨场景部署的技术基础。
结语
从Imagination的E系列GPU等产品实现的架构创新来看,用于智能汽车等端侧应用的AI芯片也在重塑其技术逻辑,更揭开了端侧AI计算革命的序幕。在智能汽车领域,功能安全、高效灵活的算力、生命周期管理与开放软件生态这四大要素构建的技术护城河,正推动行业从“硬件堆砌”向“智能进化”转型;而在更广阔的端侧 AI场景中,这种“软件定义硬件”的理念正在帮助消费电子、工业物联网、智慧城市和智能商业等边缘计算等领域全面拥抱AI技术。
这种变革的深层意义,在于打破了“云-边-端”的技术壁垒。当智能汽车的GPU架构能够通过软件升级支持智慧城市的交通调度算法,当工业设备的计算单元可复用至消费电子的AI交互场景,端侧AI正从单一功能模块进化为“可生长的智能体”。可进化的端侧芯片将如同今日的CPU般,成为所有智能设备的“数字大脑”。
评论