选对运用软件的方法,使 AI 创新如虎添翼
正如 Arm 工程部软件高级副总裁 Mark Hambleton 在 《2025 年芯片新思维》报告 中所说:人工智能 (AI) 的未来发展离不开软硬件的协同。
本文引用地址:https://www.eepw.com.cn/article/202506/471742.htm然而,在由 Arm 赞助的新 CIO 报告中所述,开发者工作流程的碎片化限制了开发者创建和扩展新 AI 应用的速度,而这也是目前其所面临的最大挑战之一。
报告下载链接: https://www.arm.com/resources/white-paper/why-software-is-crucial
Arm 深知软件对于释放 AI 的真正潜力至关重要,因而从基础架构和整个技术栈入手,致力于简化 AI 开发流程,并支持新 AI 应用和工作负载实现无缝性能加速。
基础架构
Arm 持续发展自身架构,作为软硬件之间的重要接口。如今,从云端到边缘侧的广泛市场中,Armv9 架构已成为智能手机、数据中心、高性能计算和汽车应用等领域的现代技术基础。
Arm 不断为最新的架构引入新的功能,例如此前推出的 可伸缩矩阵扩展 (SME) 和 可伸缩向量扩展 (SVE2) ,有助于在各类应用中加速生成式 AI 和常见机器学习 (ML) 工作负载。SME 借由在通用指令集中引入复杂矩阵处理能力,使开发者能够在其 AI 应用中实现出众性能,并无缝迁移到不同的生态系统。由此不仅扩大了运行 AI 工作负载的硬件范围,还显著提升了用户体验。
CPU 对开发者的价值
上述架构特性都集成到了 Arm 的 CPU 中,使之成为软件开发者首选的目标平台。因为 Arm CPU 广泛应用于从云端到边缘侧的各种应用,适合作为大多数 AI 推理工作负载的直接目标平台,被广泛应用于数十亿台设备中,例如当今的智能手机,以及全球的云端和数据中心。通过选择 Arm CPU 作为目标平台,开发者能够以更多类型的数据格式运行更广泛的软件,而无需为专用 NPU 开发多个版本的代码。
CPU 为开发者提供了所需的一致性,避免了定制硬件解决方案所带来的碎片化和效率低下。
正如 Hambleton 在《2025 年芯片新思维》报告中指出:AI 框架的互操作性是开发者的核心诉求。因此开发者通常默认选择 CPU 后端,因为 CPU 的普遍性确保了更广泛的兼容性。
此外,推动 AI 工作负载扩展的因素不仅限于架构的进步。
在 CIO 报告中,Arm 工程部机器学习工程副总裁 Nick Horne 表示,AI 已经从依赖云端的庞大模型演变为可在边缘侧或端侧运行的更小、更高效的模型。他指出:如今,有些出色的模型可在你随身携带的设备上运行并提供高质量的结果,某些情况下甚至能够完全在 CPU 上运行。
对开源不变的承诺
Arm 与开源社区广泛合作,致力于推动 AI 的普及,为开发者提供便捷途径,使开发者能够轻松获取来自广泛 Arm 生态系统合作伙伴的硬件,及时利用其中的最新架构特性和性能。
Horne 在 CIO 报告中强调了这一方法为开发者带来的优势。他指出:采用具有良好硬件抽象的开源 AI 框架,能够显著避免对灵活性的影响。
如此一来,开发者无需受限于特定硬件、云服务提供商或软件平台。
Kleidi 助力轻松加速 AI
Arm Kleidi 很好地体现了上述优势的实际应用效果。Kleidi 提供开发者支持技术、资源和微内核库,能够为在 Arm CPU 上运行的模型轻松实现 AI 工作负载加速。由于 Kleidi 库已集成到主流的开源 AI 框架和运行时中,包括 Google 的 MediaPipe 、Meta 的 ExecuTorch 和 PyTorch 、llama.cpp,腾讯的 Angel ,以及阿里巴巴的 MNN 。开发者无需额外工作即可获得性能优化,从而节省时间、精力和成本。Kleidi 现已集成至 Arm 技术覆盖的所有市场,包括移动端、云、数据中心、 汽车 和物联网领域。
与行业领先的生态系统合作
从更广泛的层面来看,Arm 通过行业领先的软件生态系统,与众多合作伙伴开展协作,致力于安全、大规模地部署 AI。例如,Arm 与 GitHub 就 GitHub Runners 项目开展合作,使开发者能够更高效地在云端测试和部署训练好的模型。近期, 面向 GitHub CoPilot 的 Arm 扩展程序 为开发者提供了完全集成的原生 Arm 工作流,包括准确的代码生成、测试用例创建和错误修复功能。
此外,Arm 还通过各种举措推动底层软件和固件部署的简化和加速,实现顺畅的软件开发。Linaro OneLab、Trusted Firmware 和 PSA Certified 等项目促进了各方协作,并为快速发展的边缘侧 AI 和高性能物联网领域的安全软件部署和支持提供了蓝图。在汽车行业,Arm 发起的面向嵌入式边缘的可扩展开放架构 (SOAFEE) 致力于提供基于标准的框架,以实现软件的规模化复用,从而缩短开发周期,满足了 软件定义汽车 (SDV) 应用中对更多 AI 的空前需求,同时提升了驾驶体验。
开放标准推动创新
最后,缺乏标准化实践可能会阻碍创新,并可能在未来给开发者制造复杂难题。开放标准使开发者和研究人员可以在不同平台之间无缝切换,同时专注于训练、量化和部署,通过模型的持续创新创造价值。
借助软件加速 AI 创新
为了让 AI 技术充分发挥潜力,软件开发流程需要简化、加速并开放。Arm 技术及其生态系统通过专注于开放标准、硬件抽象并与不断演变的框架保持兼容,助力实现面向未来的 AI 开发。开发者因而能够在不同硬件上无缝创建和部署 AI 应用、模型和工作负载并提升性能,从而基于 Arm 平台为 AI 时代打造更优质的软件。
评论