"); //-->
1月12日消息,英国金融时报近日报道称,据熟知详情的工厂经理与芯片买家透露,近几个月来,每月有数以千计的英伟达游戏显卡在工厂、工作站被拆出核心的GPU芯片,然后安装到新的电路板上。
一名工厂经理表示,仅是2023年12月,工人就拆解了超过4,000片英伟达游戏显卡,数量是11月的四倍以上。这些拆解出来的GPU芯片主要供应上市企业及小型AI实验室,他们来不及在美国出口管制生效前,囤积足够的英伟达AI芯片。


据介绍,英伟达目前最强的游戏显卡GeForce RTX 4090是热门改造单品,因为这款显卡如今已被禁止出口到中国。
业界专家及分析师警告,改造英伟达产品违反该公司的知识产权,部分游戏显卡随时都可能遭禁。
86Research分析师Charlie Chai指出,由于2023年10月美国政府扩大了对于AI芯片的出口管制,这是中国企业情急之下的无奈之举,就好像用厨刀进行艺术创作一样,虽可行、但效果欠佳。
虽然英伟达在2023年12月推出面向中国市场的降速版RTX 4090 D,但是其整体性能相比原来的 RTX 4090降低了约10%左右。
根据公布的资料显示,RTX 4090 D搭载了AD102-250 GPU,CUDA核心数量从RTX 4090的16,384个减少至14,592个((128 个 SM 减少到 114 个 SM),降低幅度达到了12.8%。同时,Tensor核心数量从512个减少至456个,RT核心数量从128个减少至114个。也就是说总体的核心数量大概减少了约11%。不过,由于RTX 4090 D的基础频率比RTX 4090的2235 MHz要高一些(提升约2.2%),由2230MHz小幅提升到了2280 MHz,弥补了一点性能损失,而加速频率则与RTX 4090相同,维持在2520 MHz。所以,综合整体计算核心数量减少的幅度以及主频提升的幅度来估算,RTX 4090 D的性能大概会比RTX 4090低10%左右。
不过,一位工厂经理则表示,RTX 4090 D 与 RTX 4090 的性能差距“较显著”,可能代表GeForce RTX 4090 D在AI方面的性能下降更多,无法用来训练大型语言模型(LLM)。
此外,英伟达虽然也基于H100开发出了三款专为中国设计的降规版AI用芯片 HGX H20、L20 PCle 和 L2 PCle(预计3月上市),但由于性能相比H100大幅降低了85%,定价却并没有降低多少,这也导致了中国客户不愿购买这些芯片。
此前的报道显示,有知情人士称,阿里、腾讯一直在测试英伟达新的特供版AI芯片样本,但是他们已经向英伟达表明,今年向英伟达订购的芯片数量将远远少于此前原计划购买的、已经被禁的英伟达高性能AI芯片。包括阿里、腾讯、百度、字节跳动等大厂正在将一些先进的半导体订单需求转移给本土公司,并且更多地依赖公司内部开发的芯片。
编辑:芯智讯-浪客剑
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
英伟达与谷歌云联手打造实体 AI 工厂
英伟达与IREN达成战略合作,共建5GW规模AI基础设施
CPU正面临严重短缺
大嘴业话——ARM再次上市,究竟7年时间算不算被偷走的?(2)
GPU的形态已彻底改变,英伟达GTC大会发布的到底是什么
英伟达旗下NVentures参投医疗AI初创公司 Aidoc,融资 1.5 亿美元
【100积分限时送】Do you have 4 mintes?
英伟达携手合作伙伴将在变电站旁建微型数据中心
《E点冷知识》:引发AI行业大地震的CUDA究竟有多强大
布局全域 AI 治理:英伟达与 SERVICENOW 落地桌面智能代理与数据中心管控体系
大嘴业话——ARM再次上市,究竟7年时间算不算被偷走的?(1)
软银携手英伟达与富士康,打造“日本制造”AI服务器
先进节点产能被大厂锁定,芯粒与先进封装成中小厂商突围之路
瞄准光通信!英伟达27亿美元“绑定”康宁
大嘴业话——英伟达宣布进军CPU市场
莱迪思联手英伟达推出 Sensor Bridge 方案 加速边缘 AI 产品落地
英伟达的智能驾驶芯片你都知道吗?