"); //-->
日前,英伟达的股价再次迎来上涨,总市值超过 2 万亿美元,成为继苹果(2.83 万亿美元)和微软(3.06 万亿美元)之后第三家估值超过 2 万亿美元的美国公司[1]。
该公司之所以在过去一年里取得如此迅猛的市值增长,主要是因为其在 AI 芯片市场发挥的领先作用。
显而易见,随着以 ChatGPT 为代表的大语言模型的陆续出现,引发了全世界生成式 AI 市场的蓬勃发展。
根据数据统计公司 Statista 提供的数据,预计到 2024 年,生成式 AI 的市场规模将达到 666.2 亿美元,到 2030 年市场规模有望达到 2070 亿美元[2]。
要想构建对于发展大语言模型来说至关重要,并且用于深度学习、大规模模拟和并行处理的应用程序,少不了使用由英伟达开发的 GPU 芯片。

图丨英伟达发布的 H100 芯片(来源:英伟达官网)
不过,由于种种原因,自 2018 年以来全球芯片一直存在短缺的现象,这给 AI、电子、汽车、医疗等行业的正常生产带来沉重打击。
一面是 GPU 短缺,一面是对生成式 AI 服务需求的持续增长,这种供不应求的态势也让英伟达于 2022 年发布的 H100 芯片极其昂贵,并且,为打造最好的生成式 AI 产品,包括腾讯、微软、Meta 等在内的中美科技公司都在追捧这款 AI 芯片。

图丨预计 H100 已于 2023 年交付给部分买家(来源:CB Insights)
其中,需要说明的是,H100 是英伟达继 A100 之后推出的最新旗舰 AI 芯片,它作为 AI 基础设施的核心,具有强大的计算能力,能够帮助训练和部署可以生成文本、图像和音频的大语言模型。
另外,根据 CB Insights 发布的 2024 年生成式 AI 预测报告,一颗 H100 的制造成本大约为 3320 美元,但平均售价已经达到 3 万美元,最高售价甚至一度达到将近 10 万美元[3]。

图丨H100 售价大幅上涨(来源:CB Insights)
从另一视角来看,这种囤积芯片的行为,也体现出大型科技公司对英伟达的过度依赖。
在意识到这一点以后,亚马逊、谷歌、微软和 Meta 等科技巨头纷纷构建自己的 AI 芯片,以及通过投资 AI 初创企业等举措,试图摆脱上述依赖,并开始试图抢占芯片市场份额。
具体来说,谷歌部署 TPU(Tensor Processing Units,张量处理器)已经有 8 年时间。
2017 年,该公司发布一款新的专用集成电路产品 TPU,能够支持 AI 神经网络的训练以及训练后的推理。
基于数以万计的 TPU,谷歌成功地构建了自己的 AI 产品,其中就有聊天机器人工具 Bard。
并且,包括 Cohere 在内的其他 AI 公司也在通过谷歌的云服务使用这些芯片,并构建类似的技术。
紧随谷歌之后的亚马逊,分别于 2019 年和 2021 年发布了 Inferentia 和 Trainium 两款芯片。
前者可提供低成本、高通量的机器学习推理,后者旨在训练机器学习模型,包括用于生成式 AI 的模型。
另外,该公司还于 2023 年 9 月给 Anthropic 这家 AI 公司注入 40 亿美元的资金,后者将使用亚马逊的定制芯片来构建 AI 模型。
亚马逊 CEO 安迪·贾西(Andy Jassy)曾在该公司 2023 年第 4 季度财报电话会议中表示:“要获得每个人都想要的 GPU 数量确实很困难。
因此,这也是亚马逊的 Inferentia 和 Trainium 芯片对人们如此具有吸引力的一个重要原因。”
2023 年 5 月和 11 月,Meta 和微软两家公司分别发布了定制 AI 芯片 MTIA 和 Maia 100。
前者是针对 Meta 内部推理工作负载定制的,在性能、延迟和效率方面都具有良好的表现,后者使用 5 纳米工艺制造,能很好地应用于大语言模型的训练和推理。
据了解,在开发和测试 Maia 100 的过程中,微软不仅和 OpenAI 开展了广泛合作,还将基于该产品为后者的 AI 模型提供优化和改进。
事实上,上述公司开发与 AI 有关的定制芯片的行为,有助于它们控制成本、消除芯片短缺,并最终向使用其云服务的企业出售芯片。
正如 AI 初创公司 Nervana 的 CEO 兼联合创始人纳文·拉奥(Naveen Rao)所言:“理论上,如果它们能够达到足够高的产量并降低成本,这些公司应该能够提供比英伟达更好的产品。”
不过,从目前来看,它们在短期之内很难超越英伟达,即便后者开发的芯片价格昂贵,但却是市场上性能最高、能与更多软件完美配合的芯片之一。
亚马逊 AWS 计算和网络副总裁大卫·布朗(David Brown)对媒体表示:“我们还有许多年的艰苦创新要做。”
我们看到各科技公司竞相开发定制芯片,但明显的是,英伟达也不会停滞不前。
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
莱迪思联手英伟达推出 Sensor Bridge 方案 加速边缘 AI 产品落地
英伟达携手合作伙伴将在变电站旁建微型数据中心
英伟达CFO:我们早就知道内存大涨价要来了
软银携手英伟达与富士康,打造“日本制造”AI服务器
GPU的形态已彻底改变,英伟达GTC大会发布的到底是什么
瞄准光通信!英伟达27亿美元“绑定”康宁
《E点冷知识》:引发AI行业大地震的CUDA究竟有多强大
先进节点产能被大厂锁定,芯粒与先进封装成中小厂商突围之路
【100积分限时送】Do you have 4 mintes?
大嘴业话——ARM再次上市,究竟7年时间算不算被偷走的?(1)
英伟达与IREN达成战略合作,共建5GW规模AI基础设施
维拉 CPU 交付:英伟达首款面向智能体的 CPU 进驻顶尖 AI 实验室
布局全域 AI 治理:英伟达与 SERVICENOW 落地桌面智能代理与数据中心管控体系
大嘴业话——英伟达宣布进军CPU市场
大嘴业话——ARM再次上市,究竟7年时间算不算被偷走的?(2)
英伟达的智能驾驶芯片你都知道吗?
英伟达 2027 财年 Q1 财报:营收利润双创新高,AI 算力需求持续爆发