AI 端侧的芯片革命
2025 年,中国开了一个好年。
本文引用地址:https://www.eepw.com.cn/article/202502/467276.htm文化市场,哪吒 2 爆火,票房已经突破了百亿,闯入全球电影 TOP 榜,向世界展示了中国市场「恐怖的」消费能力。AI 市场,DeepSeek 的横空出世,更低的算力达到 Chat GPT 的效果,直接刷屏全球热搜榜。
如果说 Chat GPT 的出现,让生成式 AI 走向了云,那么 DeepSeek 则是让生成式 AI 走向了端。
端侧 AI 芯片的「黄金拐点」
科技行业一直在探索 AI 硬件产品。
从今年「消费电子届春晚」CES 上来看非常明确。今年 CES 上的各大公司推出的产品都与 AI 强相关,无论是通用的 PC,还是手机终端,再到机器人、眼镜、耳机、手表等等,几乎每种产品只要存在人机交互的硬件终端,都有厂商尝试将其与 AI 大模型结合。
但这些探索似乎都不太成功。大模型推出了成百上千种,硬件产品更是成千上万种,但效果不甚了了。究其原因,还是本地 SoC 提供的算力和大模型需要的算力无法匹配。
ChatGPT 时代,大模型的蒸馏是很大的问题。如果采用云端调用算力完成 AI 推理,就存在三个问题:第一,成本。云端的任何操作都是有成本的,可能不多,几分人民币,但总之是要花钱的。
有手机厂商透露,调用一次云端大模型的平均成本在 1.2 分到 1.5 分人民币,假设每个品牌都有上亿的用户量,每人每天调用 10 次,这其中的算力成本非常惊人。但是如果按次数或月租向用户进行收费,在功能同质化的情况下,用户的使用意愿也会很难保证。
第二,速度。既然是云端完成,那么必然需要进行网络传输,这就导致 AI 在终端的响应速度慢。如果是自动驾驶中的汽车,对于当前环境需要在 10 毫秒内决策,靠着云端未免过于危险。在自动驾驶、工业质检等场景,端侧推理延迟能够降至毫秒级,较云端方案提升 5 倍。
第三,隐私。这是最重要的部分,涉及到医疗和金融等内容,对于用户来说,端侧模型才是最优解。
所有人内心都有一个答案:端侧 AI 才是 AI 硬件落地的关键。
小尺寸模型落地端侧已经开始了。
自华为宣布「小艺智能体」接入 DeepSeek-R1 算起,在一周多的时间里,包括星纪魅族、荣耀、OPPO、努比亚、vivo 在内的 6 家手机厂商宣布接入 DeepSeek。
需要解释的是,满血版 DeepSeek-R1 模型参数达到 671B,仅模型文件就需要 404GB 存储空间,任何一种移动设备都无法满足这样的硬件配置需要。但 DeepSeek 蒸馏版本(1.5B、7B)适合手机等端侧使用。
为了让这些小尺寸模型在端侧流畅运行并充分发挥其智能优势,就需要性能强劲的端侧 AI 芯片来提供算力支持。
市场对于能适配小尺寸模型运行的端侧 AI 芯片需求开始水涨船高。
赛道主力玩家
端侧的应用市场非常大,前文我们提到,只要存在人机交互的硬件终端,都有厂商尝试将其与 AI 大模型结合。我们可以在这里具体看一下:
AI PC 领域,2027 年 AI PC 在中国 PC 市场占比能够达到 85%;AI 手机领域,2026 年,AI 手机的出货量预计将突破 4.7 亿部,渗透率增至 38%;在 AI 可穿戴设备领域,市场规模预计将从 2024 年的 419 亿美元增长至 2028 年的 1207 亿美元,CAGR 达到 30.3%。
2023 年中国端侧 AI 市场规模为 1,939 亿元,从 2018 至 2023 年,其年均复合增长率为 116.3%。
DeepSeek 首先带动是 AI 端侧的 SoC 芯片需求。
SOC 芯片是各类型硬件设备的主控单元,承载着运算控制等核心功能,是硬件的「大脑」。随着 AI 在边缘侧的应用越来越广泛,SOC 将更加变成集成人工智能和边缘计算能力的系统级芯片,成为 AI SOC,算力达到几十甚至数百 TOPS。
在这次端侧 AI 热潮中,瑞芯微频频涨停。
目前,瑞芯微能够提供从 0.2TOPs 到 6TOPs 的不同算力水平的 AIoT 芯片,其中 RK3588、RK3576 带有 6TOPs NPU 处理单元,能够支持端侧主流的 0.5B~3B 参数级别的模型部署。可通过大语言模型实现翻译、总结、问答等功能,并可实现多模态搜索、识别,有效解决不同 AIoT 场景的痛点,提升产品使用体验。
其中,公司 SOC 芯片拳头产品 RK3588M 是国内少数能媲美国外一线产品的智能座舱 SoC 芯片。
据瑞芯微透露,该产品性能优异,一芯带多屏、端侧 AI 等能力突出,已落地应用于众多头部车厂,量产车型 10 余款,超 20 款定点车型项目在同步开发中。此外,新产品 RK3576M 也正在进行客户导入。
这还仅是瑞芯微端侧 AI 产品应用的一个方面。
事实上,当前已有多个领域的客户基于瑞芯微主控芯片研发在端侧支持 AI 大模型的新硬件,例如教育平板、AI 玩具、桌面机器人、算力终端、会议主机等产品。
全志科技也是一家备受关注的 SoC 企业。去年公司全年实现属于上市公司股东的净利润为 1.53 亿元–1.9 亿元,同比增长 566.29%~727.42%。业绩暴增的原因,则是以扫地机器人、智能投影等业务线为代表的产品出货量显著提升,致使营业收入同比增长约 35%。
在记者问询全志科技产品是否能适配 DeepSeek,是否针对 DeepSeek 进行布局时,全志科技表示:「公司产品可以为端侧多种形态的智能终端产品提供算力支持。」
乐鑫科技 SoC 长期应用于泛 IoT 领域。从应用端看,乐鑫科技在智能家居、智能照明和消费电子等核心应用市场合计达到了 30% 以上的增长。
乐鑫科技 ESP32-S3 和 ESP32-P4 产品线都有添加边缘 AI 的功能,主要体现为设备端语音唤醒与控制,以及图像处理的功能。这两个系列的芯片在硬件设计上增加了 AI 加速指令;而在软件层面,也提供图像识别和语音唤醒、控制等方案。
乐鑫科技副总经理王珏表示:「公司带端侧 AI 功能的 AIoT 芯片 ESP32-S3 目前增长非常迅速,也是当前主推的旗舰产品。」字节跳动的 AI 玩具「显眼包」中用的也是乐鑫的芯片 ESP32。
晶晨股份已有超 15 款商用芯片搭载其自研的端侧 AI 算力单元,2024 年携带自研端侧 AI 算力单元的芯片出货量超过 800 万颗。
2024 年年度实现营业收入 59.21 亿元左右;归母净利润约 8.2 亿元左右,同比增长 64.65% 左右。该公司表示,其 6nm 芯片 S905X5 系列可利用端侧 AI 能力,实现本地同声翻译、同声字幕等功能,商用半年以来取得多个国际 Top 级运营商的订单,预计 6nm 芯片有望在 2025 年达成千万颗以上的销量。
端侧的 AI 音频处理器应用场景多是在智能物联网领域。比如,在智能音响中,端侧 AI 音频处理器能够支持语音唤醒、语音识别、语音合成等功能,实现用户与音箱的自然语言交互。在智能家居系统中,它可用于声音控制家电设备,如通过语音指令调节灯光、空调、电视等。
恒玄科技的端侧 SoC 已经成功搭载在多家主流品牌产品里,包括百度、字节跳动、谷歌、哈曼、安克创新、漫步者、韶音等。今年,字节跳动推出的首款搭载豆包大模型的智能耳机 Ola Friend,搭载的就是恒玄科技 2700 芯片。恒玄科技的最新芯片 BES2800 还被应用于三星 2024 年最新发布的 Galaxy Buds3 Pro 耳机中。多款耳机的应用,能够看出恒玄科技在智能终端 SoC 芯片领域处于领先地位。
对于端侧 AI 对于芯片要求的变化,恒玄科技认为:「云端大模型的兴起除了对 AI 手机、PC 带动外,可穿戴也是会受益于端侧 AI 的发展,它对芯片会提出新的需求,比如可穿戴的环境感知能力要变得更强,所以主控芯片的算力需要相应提升,同时可穿戴产品长续航是刚需,所以芯片在算力提升的基础上还要保持较低的功耗水平。」
值得一提的还有 AI 眼镜芯片。行业普遍认为眼镜是目前最火的 AI、大模型的落地载体,今年行业将会完成 0 到 1 的突破。
之前在 2017 年,Meta 就开始自研 AI 眼镜,最开始是和三星合作,但是三年都没出什么结果,然后告吹了。之后 Meta 放弃了自研芯片,Ray-Ban 眼镜使用了高通的 AR1 Gen 1 芯片。
可以说,在 ARVR 芯片这个领域,高通还是处于绝对的控制地位。在市面上,AI 眼镜能用上的芯片,除了高通芯片,那就是紫光展锐的 TW517。
紫光展锐TW517 采用 12nm 工艺,GPU 型号为 IMG8300,运行频率 800MHz。主要客户是闪极 AI 拍拍镜、影目科技。
同时,恒玄科技此前透露,该公司芯片已在魅族等智能眼镜产品中应用发布,同时有一些客户项目正在导入阶段。
结语
哪吒 2 突破百亿票房,向世界展示了中国市场「恐怖的」消费能力。这意味着:单凭中国市场的规模和消费能力就抵得上全球其他发达国家的总和。
这背后传递的信号非常积极。
如果只看电影市场,可能还不太理解。但如果放到科技和制造业中来看就会明白其中的巨大价值。
接下来不管欧美再怎么对我们进行贸易和科技壁垒,都不可能阻止我们产业升级。对于科技和制造的最大障碍,并不是「卡脖子」,而是前期没有足够大的消费市场买单,就无法形成相关产业链的建立。
举个例子,某企业研发一款芯片,从设计到量产累计成本要 2 个亿,如果只卖出十万片那每个芯片的成本等于是 2000 块,这个价格太高了,企业肯定无法盈利。只能陷入长期亏损,最终倒闭出局。但是如果能够卖出 1 亿片,那每片成本只需要 2 块钱。这个成本的大幅度摊薄就会让企业有利润继续投入研发。
因为市场体量足够大,有足够多的买家帮助消化成本,公司就能赚钱、行业就能发展,这就是中国市场的魔力。
国信证券研报观点称,2024 年电子行情由「周期复苏」向「成长创新」切换,2025 年行业有望迈入估值扩张大年。应用端 AI 革新人机交互,以语音交互为核心的 AI 端侧应用正处在大规模商业化的临界点,创新催化频繁。
相比 AI 云侧,国内半导体企业将在 AI 端侧创新中实现更高的市场参与度,同时国产半导体自给率仍偏低,两者共振奠定了行业成长的确定性和空间。
评论