新闻中心

EEPW首页 > 网络与存储 > 市场分析 > 图形处理单元(GPU)、中央处理单元(CPU)、定制人工智能专用集成电路(ASIC)以及其他人工智能加速器,涵盖参与者分析、技术、趋势、供应链和预测

图形处理单元(GPU)、中央处理单元(CPU)、定制人工智能专用集成电路(ASIC)以及其他人工智能加速器,涵盖参与者分析、技术、趋势、供应链和预测

作者:Jameel Rogers 时间:2025-05-06 来源:EEPW编译 收藏

前沿人工智能吸引了全球数千亿美元的投资,各国政府和超大规模提供商竞相在药物发现和自主基础设施等领域取得领先地位。图形处理单元(GPU)和其他人工智能芯片在推动人工智能增长方面发挥了重要作用,为数据中心和云计算基础设施中的深度学习提供了所需的计算能力。GPU在提供计算能力方面发挥了关键作用,是大型语言模型(LLM)和生成式人工智能浪潮下的主导力量。然而,随着对更高效计算、更低成本、更高性能、大规模可扩展系统、更快推理和特定领域计算的需求增加,其他人工智能芯片也有机会在流行度上增长。

本文引用地址:https://www.eepw.com.cn/article/202505/470102.htm

随着人工智能芯片的格局从仅限于GPU扩展到更多新型架构实现大规模商业化,IDTechEx的报告《2025-2035数据中心和云计算中的人工智能芯片:技术、市场、预测》提供了对数据中心和云计算中人工智能芯片市场的独立分析。这包括对当前和新兴技术的基准测试、技术分解和关键趋势的分析,涵盖了当前和新兴的硬件架构、先进节点技术和先进半导体封装,以及供应链、投资和政策方面的信息。报告提供了2025年至2035年数据中心和云计算人工智能芯片市场的详细收入预测,按人工智能芯片类型划分,包括GPU、超大规模提供商和提供商(CSP)使用的定制人工智能专用集成电路(ASIC)、具备人工智能能力的中央处理单元(CPU)以及其他由人工智能芯片初创公司和大型供应商开发的人工智能ASIC。

image.png


图形处理单元(GPU)

人工智能最大的系统是大规模扩展的高性能计算(HPC)和人工智能系统——这些系统大量使用GPU。这些通常是超大规模人工智能数据中心和超级计算机,它们都可以提供每秒千万亿次浮点运算(exaFLOPS)的性能,无论是本地部署还是通过分布式网络。近年来,NVIDIA凭借其Hopper(H100/H200)芯片取得了显著成功,并最近发布了Blackwell(B200/B300)芯片。AMD也凭借其MI300系列处理器(MI300X/MI325X)创建了具有竞争力的芯片。由于美国对先进芯片的制裁,中国参与者也在开发解决方案。这些高性能GPU继续采用最先进的半导体技术。一个例子是增加芯片上内存容量,顶级芯片拥有超过250GB的高带宽内存(HBM),使具有更多参数的更大人工智能模型能够在这些GPU上运行。这些芯片还采用了最先进的半导体封装解决方案,如台积电的CoWoS-L封装、小芯片和多芯片GPU,以及最先进的工艺节点(5纳米及以下)。报告中详细探讨了所有这些趋势和市场活动。


超大规模云服务提供商和云服务提供商使用的定制人工智能芯片

GPU一直是训练人工智能模型的基础,但存在局限性,例如高总拥有成本(TCO)、供应商锁定风险、特定人工智能操作的低利用率,以及对于特定推理工作负载可能过于强大。超大规模云服务提供商采用的一种新兴策略是使用基于脉动阵列的定制人工智能ASIC。这些芯片为人工智能工作负载设计了专用核心,每个操作的成本更低,针对特定系统(例如,变换器、推荐系统等)进行了优化,提供了高效的推理,并为超大规模云服务提供商和云服务提供商提供了在不牺牲性能的情况下实现全栈控制和差异化的机会。报告提供了潜在风险评估、关键合作伙伴关系、参与者活动、基准测试和技术概述。


其他人工智能芯片

其他人工智能芯片正在被商业化以颠覆GPU,具有类似和新颖的计算架构。一些大型芯片供应商,如英特尔、华为和高通,设计了人工智能加速器(例如,Gaudi、Ascend 910、Cloud 100),使用类似于GPU的异构计算单元阵列,但专门用于加速人工智能工作负载。这些芯片在性能、能效和特定应用领域的灵活性之间取得了平衡。通常,这些芯片包含矩阵引擎和张量核心,这些核心被设计为以高吞吐量执行密集的线性代数运算,如GEMM(通用矩阵乘法)和BMM(批量矩阵乘法)。

专注于人工智能芯片的初创公司通常采用不同的方法,部署前沿架构和制造技术,如数据流控制处理器、晶圆级封装、空间人工智能加速器、内存中处理(PIM)技术和粗粒度可重构阵列(CGRAs)。许多公司已成功推出这些系统(Cerebras、Groq、Graphcore、SambaNova、Untether 等),用于数据中心和云计算,通常开发机架级解决方案以便于企业部署,或在其自己的云平台上提供使用。这些系统在扩展环境中表现卓越。IDTechEx的报告提供了全面的基准测试、比较、关键趋势、技术分解和参与者活动。


设计人工智能芯片和供应链

开发具有竞争力吞吐量的人工智能芯片,用于训练(训练时间)和推理(每秒令牌数),高能效(TOPS/瓦特)以及相关的软件支持,对所有芯片设计者来说都是一个严格的挑战。这个过程涉及到许多步骤的精细平衡,包括选择编程和执行模型、设计优化的硬件和内存架构,以及使用先进工艺节点和先进半导体封装进行制造。例如,数据中心芯片正在采用台积电、英特尔代工和三星代工的最先进工艺节点,使用ASML的极紫外(EUV)光刻技术。这些代工厂正在推动晶体管技术从5纳米技术发展到使用FinFET(Fin场效应晶体管)的2纳米节点以下,使用GAAFET(环绕栅极FET)和背面供电。报告中包含了最近的制造发展、设备要求、硬件架构分解、先进半导体封装细节、供应链以及编程模型比较。

设计和制造中涉及的各种技术为整个半导体行业供应链的未来技术创新提供了广泛的空间。政府政策和大量投资显示出推动前沿人工智能达到新高度的普遍兴趣,这将需要在人工智能数据中心中使用大量的人工智能芯片来满足这一需求。IDTechEx预测,从2025年到2030年,这一市场将以14%的年复合增长率增长,收入超过4000亿美元。



关键词: AI 云服务

评论


相关推荐

技术专区

关闭