"); //-->

2月20日消息,对于 x86、Arm、MISC 和 RISC-V 等处理器架构都有深入研究的传奇处理器架构师Jim Keller在本周末批评了被外界认为是英伟达(NVIDIA)“护城河”的 CUDA架构和软件堆栈,并将其比作x86,称之为“沼泽”。他指出,就连英伟达本身也有多个专用软件包,出于性能原因,这些软件包依赖于开源框架。

“CUDA 是沼泽,而不是护城河,”凯勒在 X 帖子中写道。“x86 也是一片沼泽。[…] CUDA 并不漂亮。它是通过一次堆积一件东西来构建的。”
确实,就像x86一样,CUDA在保持软件和硬件向后兼容性的同时逐渐增加了功能。这使得英伟达的平台完整且向后兼容,但它影响了性能并使程序开发变得更加困难。同时,很多开源软件开发框架可以比CUDA更高效地使用。
“基本上没有人编写 CUDA,”Jim Keller在后续帖子中写道。“如果你确实编写 CUDA,它可能不会很快。[...] Triton、Tensor RT、Neon 和 Mojo 的存在是有充分理由的。”
甚至NVIDIA本身也有不完全依赖 CUDA 的工具。例如,Triton Inference Server 是 Nvidia 的一款开源工具,可简化 AI 模型的大规模部署,支持 TensorFlow、PyTorch 和 ONNX 等框架。Triton 还提供模型版本控制、多模型服务和并发模型执行等功能,以优化 GPU 和 CPU 资源的利用率。
NVIDIA的TensorRT是一种高性能深度学习推理优化器和运行时库,可加速NVIDIA GPU上的深度学习推理。TensorRT 从各种框架(例如 TensorFlow 和 PyTorch)中获取经过训练的模型,并对其进行优化以进行部署,从而减少延迟并提高图像分类、对象检测和自然语言处理等实时应用程序的吞吐量。
但是,尽管像Arm、CUDA 和x86这样的架构可能会被认为是“沼泽”,因为它们的演进速度相对较慢、必须向后兼容并且体积庞大,但这些平台也不像GPGPU这样分散,这可能根本不是一件坏事。
目前尚不清楚 Jim Keller 对 AMD 的ROCm和英特尔的OneAPI有何看法,但很明显,尽管他花了很多年时间设计 x86 架构,但他并不迷恋其未来前景。他的言论还暗示,尽管他曾在世界上一些最大的芯片制造商工作过一段时间,包括苹果、英特尔、AMD、博通(现在是Tenstorrent)等公司,但我们可能不会在NVIDIA的名单上看到他的名字。
编辑:芯智讯-林子
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
嵌入式处理器选型 下
英特尔研发 “统一核心” 架构处理器,招聘信息透露其将突破现有混合架构设计
AVR处理器上嵌入式Web Server
Lisatek推出嵌入式处理器设计工具(摘自www.embed.com.cn)
最新的ARM技术以及嵌入式发展动态 下
嵌入式系统综述之二(老站转)
[转帖]IBM可编程网络处理器
英特尔推出第二代酷睿系列处理器,搭载实时处理性能并扩充边缘 AI 产品矩阵
马斯克展示特斯拉AI5处理器样片,口误感谢TSC而非台积电
彻底告别486:Linux内核维护者正式移除英特尔486处理器支持
基于GP4020的GPS接收机基带处理器电路
对数压缩方式数字音频处理器(DAC76、MN5110)
英特尔推出第二代酷睿处理器
SRS效果处理器
德国初创杀进 RISC‑V,首款通用处理器流片
英特尔确认取消酷睿 Ultra 9 290K Plus 处理器,
程控开关电源用于片心逻辑―Pentium Pro处理器
俄罗斯发布基于中国龙芯架构的处理器
嵌入式系统硬件接口设计 上
英特尔和SambaNova将Xeon 6定位为人工智能推断目标
嵌入式系统硬件接口设计 下
运放型BBE处理器
LINUX 精华
英特尔产能先供服务器Xeon处理器 联发科、AMD掘金CPU缺货商机
常用嵌入式系统,处理器,开发工具分类(PDF)
PoerPC处理器的BDM调试头原理图
嵌入式处理器选型 上
德州仪器推出用于OMAPTM无线处理器的新型开发套件
嵌入式系统综述之三(老站转)
Nios II 处理器中文小册子(altera)