新闻中心

EEPW首页 > 智能计算 > 市场分析 > 买一万张芯片,造一个新帝国

买一万张芯片,造一个新帝国

作者:时间:2023-04-26来源:半导体产业纵横收藏

曾与其他业界大佬共同发出暂停 GPT-4 以上的大型语言人工智能模型的开发声明,但随后却成立了新的 公司,并采购了上万张 NVIDIA 最新的 加速卡,开始发展自己的 GPT 人工智能模型。这让人们感到困惑,不知道在想什么。甚至被业界质疑是不是想要拖慢 Open 的发展脚步好让自己可以取而代之?

本文引用地址:http://www.eepw.com.cn/article/202304/446027.htm

基本上,发展的 AI 都是为了服务人类的创意,并取代重复的人类工作,但随着 ChatGPT 的推出,创意和逻辑这块很快就被 AI 取代了一大部分,马斯克在这时创立 X.AI,并且要推出「真实」的 GPT 模型,也让人怀疑,马斯克这是在打脸自己?然而事情并不是那么单纯…

当然,马斯克与 OpenAI 之间的恩怨已经有很多人谈过,他们之间的是非对错其实也很难三言两语就解释清楚,因此我们这次就来了解马斯克在 AI 这条路上做了什么,以及以后他藉由 X.AI 来做什么,然后来尝试解答马斯克创立 X.AI 公司的目的。

广被误解的自动驾驶

先从马斯克的 AI 发展历程稍微回顾一下,马斯克最早投入 AI 议题是从自动驾驶技术开始,早在 2014 年时,特斯拉开始在其 Model S 上引入最早的一代 Autopilot 技术,随后也推广至 Model X 车种,当时这个系统虽然号称自动驾驶,但实际上汽车无法自行决定路线、方向,也无法判断路况,只能进行简单的车道置中以及变换车道,虽好于目前的 L2 驾驶辅助,但仍远远谈不上自动驾驶。

当然,自动驾驶被误解其实也是中文翻译的问题,比如说飞机上的 AutoPilot 其实也是翻译成自动驾驶,但实际上,飞机的自动驾驶也只是在固定的高度维持飞行,而不是可以从起飞、航线变换到降落都可以交给飞机。不过当时的汽车产业界对其所谓自动驾驶的定义非常苛求,认为以特斯拉当时的 AutoPilot 功能,根本称不上自动,特斯拉也因此饱受责难。

加上当时选用的硬件是基于 Mobileye 的 ASIC 方案,性能非常弱,即便后续更新软件,也没办法满足消费者的需求。

因此,马斯克后来在 2016 年结束语 Mobileye 的合作,转而与 NVIDIA 进行合作。众所周知,NVIDIA 在 2010 年左右开始发展其 CUDA 与 GPGPU 生态,并借此推动人工智能的发展,随后也以 Tegra 方案为基础推出自动驾驶方案。

NVIDIA 的自动驾驶方案的确强大许多,但仍远不及马斯克心中的想像,加上后续的中国电动车企业小鹏爆发用 AutoPilot 原始码并与 NVIDIA 进行合作的争议之后,特斯拉随即结束与 NVIDIA 的合作关系,并转而自行研发真正的自动驾驶平台。

而马斯克也重新定义自动驾驶的英文名称,将其称为 FSD(Full Self Drive),不在名称上走擦边球,马斯克信心满满,觉得在 2020 年就能推出全功能的 FSD 正式版,但截至目前为止,FSD 仍处在测试版阶段,目前最新版本是 Beta 11.4。

FSD Beta 彻底翻转以往自驾车逻辑,采用新空间占量概念(Occupancy Network),不再以连续单张图片为基础,而是以物体体积的影片为基础运算,克服许多自驾技术困难,无需光达、雷达和高精地图,以纯视觉就能做到极接近人类驾驶的程度。虽然还有些小瑕疵,但在业界也已经是表现最好的自动驾驶系统。

那么 FSD 是如何被打造出来的?我们可以分为两个部分来看,一个是汽车上的推理核心,负责现场驾驶行为的判断与执行,另一个是云端的训练工作,负责从个别的特斯拉汽车收集驾驶资讯,并以之训练精进 FSD 的驾驶模型。

汽车上的推理芯片由特斯拉自行研发,命名为 Hardware x.0,目前版号已经到 4.0,由三星代工生产,基于 Exynos 手机芯片架构改造。总运算性能达到 490TOPS,超越 NVIDIA 最新自动驾驶平台 Driver Orin 的 254TOPS。

而云端的部分也有不小的变革。原本特斯拉是采用 NVIDIA 的 GPU 来打造自有的超级电脑,并以之训练自动驾驶模型,该超级电脑使用了 7360 颗 NVIDIA 的 A100 运算芯片,在 2022 年底可以排上全球第七强超级电脑。

透过此超级电脑,特斯拉已经可以做到道路物件的标记完全自动化,并且能够更快的基于特斯拉回传的驾驶资讯训练改进驾驶模型。然后马斯克也就辞退了之前为特斯拉工作的 800 名标记师。

不过 NVIDIA 的方案显然还是无法满足特斯拉,同样是在 2022 年,特斯拉在 AI Day 上公布了 Dojo 计划,包含 Dojo 视觉训练芯片以及超级电脑丛集 ExaPod,预计在 2023 年上线,届时将是性能高达 1.1 EFLOP 的恐怖怪物级超级电脑,性能是现有基于 GPU 架构超级电脑的 4 倍以上。

超级工厂与 AI

除了特斯拉电动车以外,用来造车的超级工厂也同样高度 AI 化,尤其大型产线机器人,几乎都已经全面自动化,这些机器人可以执行复杂的操作,甚至在有需要时可以自动变换工具来执行不同的组装任务,因此,特斯拉的产能不断获得提升,成本也不断下降。

特斯拉表示,超级工厂虽然还有数千名员工,但整合 AI 机器人之后,工作流程可以由软件定义、训练、最佳化,极大的改善了制造流程。

而超级工厂下一步,则是要引进在 2022 年发表的特斯拉 Optimus 人形机器人,透过这个机器人,可以大量取代需要使用到人工的重复性工作。该机器人基本上就是一个人形化的特斯拉汽车,其处理器、电池还有许多电机技术,都是来自特斯拉。

充电一次就可以工作一整天。马斯克表示,最快在 2023 年内进行量产,并引进超级工厂。马斯克表示,就如同特斯拉的自动驾驶系统是要用来代替人类执行重复且无聊的驾驶工作,Optimus 也是要用来代替人类进行日常购物、清扫、搬运等重复性工作。

新公司 X.AI 回归 NVIDIA

既然特斯拉已经有能力发展自己的超级电脑芯片与超级电脑丛集,那为何马斯克的新 AI 公司仍采购近万颗 NVIDIA 最新的 H100 芯片来建立资料中心?答案其实很简单,那就是特斯拉自有的 Dojo 芯片主要是针对视觉处理工作而设计,软件框架较为固定,没有办法像 NVIDIA 在提供高弹性的同时,也具备高性能。

同时,X.AI 公司要发展的是类似 OpenAI 的 ChatGPT,这类大型自然语言模型的训练工作还是 NVIDIA 的强项。完整版 H100 芯片能达到 60TFLOPS 的 FP32 运算能力,D1 则仅为 22TFLOPS,不过 D1 支援特斯拉自订的 CFP8 浮点格式,比较擅长用于自家的驾驶模型训练工作。

而如果根据新闻讯息,X.AI 采购了一万张 H100 演算卡,那么初期 X.AI 的运算能力是超越算出 GPT4 的 OpenAI 所使用的上万张 A100,因为就纯粹性能,H100 是 A100 的 4 倍以上。

也就是说,如果马斯克要训练出一个 GPT4 等级的 AI 模型,那么理论上性能是绰绰有余的。不过 OpenAI 背后还有微软这个大金主存在,OpenAI 除了自身拥有内建上万张 A100 的超级电脑以外,还有微软 Azure 具备的运算力,包含超过一万张基于 A100 加速卡的超级电脑丛集,专门服务 ChatGPT,以及已经采购的超过 7000 张的 H100,将会用来建立新的演算力来服务 GPT4 或未来的 GPT5,OpenAI 负责训练,而微软这边则是主要提供让 ChatGPT 可以连接到微软旗下应用的庞大推理能力,当然,微软也有可能出借部分运算能力给 OpenAI 以供其训练模型之用。

马斯克的目的是什么?

那么回过头来看,马斯克的 X.AI 想要服务的是哪些客户?想要达到的是哪些目的?从过去马斯克的作法来看,他一直利用 AI 来取代偏劳力类型的人类工作,但是 ChatGPT 是要取代人类的部分思想与思考能力,让人脑专注于创意以及设定工作目标,专业知识与工作流程则是由 ChatGPT 来代劳,所以马斯克也要学 OpenAI +微软,开始要抢某些白领工作了?

不过马斯克强调,他的模型将会专注于真相的传达,不要有偏见,也不要有限制。然而没有限制的 AI 听起来似乎更危险?完全中立似乎也是另外一种偏见?

对此,由马斯克所招募,担任 X.AI 核心技术研发与管理的前 DeepMind 与 OpenAI 研发工程师伊戈尔·巴布什金(Igor Babuschkin)表示,他们更重视语言模型的推理能力与真实性,比如说 GPT3.5/4 都会在某些程度上虚构答案,而且这些模型还无法解释为什么要给出特定的答案,因为逻辑都藏在 AI 模型的黑盒子中。

如果 X.AI 所研发的模型能够具备更好的逻辑推论与分辨事实的能力,那是不是也要将人类目前所能担任的指示、监督与核实 AI 所产生的内容的工作也剥夺走,未来的 AI 将可以全自动根据其观察到的现况设定目标、解决问题,不需要人类插手,而且也不用怕会像 GPT3.5/4 一样会自欺欺人,造成潜在的灾难?

那不是比 ChatGPT 更危险吗?对此,马斯克其实还留有一手,他认为,如果打不过 AI,那么就加入它,让大脑透过 NeuraLink 连接电脑/ AI,一起协同工作,透过强化人类大脑,来让 AI 无法取代,或者,让大脑本身变成 AI 的一部份。

Neuralink 目前还在实验阶段,但是进展相当快速,根据实验结果,已经能够让猴子进行超越人类反应的电脑操作。不过 Neuralink 目前还有不少包括伦理上的争议,以及技术上的困难,要普及恐怕有点困难,但等到大型语言模型普及,甚至可以完全自主的 AI 模型出现,届时人类可能也没有太多选择了?



关键词: 马斯克 AI

评论


相关推荐

技术专区

关闭