"); //-->
大模型经过2025年的发展,行业逐渐形成共识:推理需求将以复合倍速增长,行业需要高性能、高性价比的芯片。基于此,1月27日,自商汤集团孵化而生的半导体公司曦望发布第三代推理GPU芯片启望S3,设定将百万token成本打到一分钱的目标。
谈及为何在此时专注推理方向,曦望董事长徐冰表示,转向推理方向是因为行业变了:需求变了,AI从能被训出来发展至能被用起来;场景变了,多模态需求爆发,Agent(智能体)需要高频响应与实时交互,物理AI(Physical AI)也在加速落地;成本结构变了,行业已将推理成本从“元级”压到“分级”,未来AI会像水电一样成为普惠基础设施。
截至目前,曦望发布了三款芯片,分别是定位云边端视觉推理专用的S1、对标英伟达A100的训推一体芯片S2,以及此次的S3。对于未来训推两端投入分配问题,采访中,徐冰对第一财经记者表示,这属于战略定力的问题,如果先将推理做到极致,也能够在商业上形成优势。预计到2030年,推理芯片将占到公司资源分配的80%。
且训推一体芯片也存在一定问题,曦望联席CEO王勇将其总结为三大困境:成本高昂,供应不稳定;能耗惊人;部署运维复杂。未来,合理的算力访存比才是芯片竞争的关键。算力访存比是衡量芯片算力与数据传输能力匹配度的核心指标。
过去芯片行业竞争的核心是“堆算力”,随着推理算力需求爆发,“内存墙”逐渐成为芯片性能的主要瓶颈。计算单元的算力提升速度远快于访存带宽的提升速度,导致大多数芯片的纸面算力无法在实际场景中释放,这一矛盾在推理芯片中尤为突出。为应对该挑战,英伟达创始人黄仁勋提出从单芯片优化升级为系统级协同设计的方案,这也是Vera Rubin平台的核心设计逻辑。
王勇也有类似观察,他对记者表示,现在的大模型公司以DeepSeek为代表,不仅会做大模型,也会牵引框架变化,带动从模型架构到算子开发、推理系统的全链路技术创新,推动框架适配新计算范式与跨硬件部署,试图摆脱对英伟达CUDA生态的依赖。此次曦望也发布了AI算力平台,以自研芯片为底座,与多家大模型进行适配,从系统侧提高芯片利用效率。
炜烨智算董事长兼CEO周韡韡表示,国产芯片定位越来越准确——从最初盲目追求与国际高性能算力的比肩,到追求性能的同时也追求极致成本。国际上,每当百万token的成本降低一半,市场上AI应用数量会显著增长,算力市场的繁荣度也将呈倍数级提升,国产算力正处于一个非常有利的位置。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。
相关推荐
我国半导体发光器件拥有了自主知识产权
伊朗冲突扰乱半导体供应链
应用材料与美光、SK海力士合作
魏哲家谈机器人:核心还是半导体
半导体压力传感器精密接口电路
半导体模拟开关电路
意法半导体完成收购阿尔卡特微电子公司
新一代的晶圆代工服务与你共赢新兴的中国半导体市场
置顶新产业 从“十五五规划纲要”解读半导体未来发展战略
美国家半导体公司在苏州兴建中国装配厂
PHILIPS 革新性的UART 解决方案
AI狂潮 半导体通膨压力重重
特斯拉招聘半导体晶圆厂建设经理 —— 马斯克雄心勃勃的太拉工厂项目正式启动
海燕牌6701型交流台式24半导体管调频调幅三波段收音、录音两用机电路原理图
大地震重创日本 台湾半导体产业受影响
2006全球半导体市场大会文字直播稿
二极管的小知识
巧判半导体二极管电路
ASML意外大裁员的背后是对半导体发展失衡的担忧
摩托罗拉半导体走向中国家电与汽车业(图)
电容式触控IC解决方案及产品发展状况
ST启动了为AI数据中心生产硅光子学
理解发展哲理 领悟发展走向——关于硅技术的思考
便携式产品低功耗电路设计的综合考虑
HOLTEK 半导体问题解答集
台湾将有条件地开放半导体业者赴大陆投资设厂
日本地震影响电子产业原材料供应
日本目标 2040 年半导体本土产值达 2500 亿美元
2026 年台积电技术研讨会:推动半导体创新未来
半导体压力传感哭接口电路