"); //-->
随着每一代新一代芯片增加晶体管密度变得越来越困难,因此芯片制造商正在寻找其他方法来提高处理器的性能,其中包括架构创新、更大的芯片尺寸、多芯片设计,甚至晶圆级芯片,比如 Cerebras的WSE系列AI芯片。
近日,中国科学院计算技术研究所的科学家们也推出了一款先进基于RISC-V架构的 256 核多芯片,并计划将该设计扩展到 1,600 核,以创造整个晶圆大小的芯片,以作为一个计算设备。
据 The Next Platform报道,中国科学院计算技术研究所的科学家在《基础研究》杂志最近发表的一篇文章中介绍了一种先进的 256 核多芯片计算复合体,名为“浙江大芯片”。
据介绍,该芯片设计由 16 个小芯片组成,每个小芯片包含 16 个 RISC-V 内核,并使用片上网络以传统的对称多处理器 (SMP) 方式相互连接,以便小芯片可以共享内存。每个小芯片都有多个芯片到芯片接口,可通过 2.5D 中介层连接到相邻的小芯片,研究人员表示,该设计可扩展到 100 个小芯片,或 1,600 个内核。

据报道,“浙江大芯片”基于Chiplet架构设计,采用 22 纳米级工艺技术制造,目前还不确定使用中介层互连并在 22 纳米生产节点上制造的 1,600 个核心组件会消耗多少功率。不过,由于延迟的减少,这将极大地优化其功耗和性能。
论文探讨了光刻和Chiplet技术的局限性,并讨论了这种新架构满足未来计算需求的潜力。研究人员指出,多芯片设计可用于构建百亿亿次超级计算机的处理器,AMD 和英特尔目前正在做这件事。
研究人员写道:“对于当前和未来的百亿亿次计算,我们预测分层chiplet架构将是一种强大而灵活的解决方案。” “分层chiplet架构被设计为具有多个内核和许多具有分层互连的小芯片。在chiplet内部,内核使用超低延迟互连进行通信,而小芯片之间则以受益于先进封装技术的低延迟互连,从而可以最大限度地减少这种高可扩展性系统中的小芯片延迟和NUMA效应”。
与此同时,研究人员建议对此类组件使用多级内存层次结构,这可能会给此类设备的编程带来困难。
“内存层次结构包含核心内存[缓存]、芯片内内存和芯片外内存,”描述中写道。“这三个级别的内存在内存带宽、延迟、功耗和成本方面有所不同。在分层chiplet架构的概述中,多个核心通过交叉交换机连接并共享缓存。这形成了pod结构,并且pod通过chiplet内网络互连,多个pod组成一个chiplet,chiplet通过chiplet间网络互连,然后连接到片外存储器,需要仔细设计才能充分利用这种层次结构合理利用内存带宽来平衡不同计算层次的工作量可以显着提高chiplet系统效率。正确设计通信网络资源可以保证chiplet协同执行共享内存任务。
大芯片设计还可以利用光电计算、近内存计算和 3D 堆栈内存等技术。然而,论文没有提供这些技术实施的具体细节,也没有解决它们在设计和构建此类复杂系统时可能带来的挑战。
编辑:芯智讯-浪客剑
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
俄罗斯发布基于中国龙芯架构的处理器
嵌入式系统综述之二(老站转)
Nios II 处理器中文小册子(altera)
Lisatek推出嵌入式处理器设计工具(摘自www.embed.com.cn)
嵌入式处理器选型 上
彻底告别486:Linux内核维护者正式移除英特尔486处理器支持
嵌入式系统综述之三(老站转)
德州仪器推出用于OMAPTM无线处理器的新型开发套件
英特尔产能先供服务器Xeon处理器 联发科、AMD掘金CPU缺货商机
运放型BBE处理器
嵌入式处理器选型 下
英特尔推出第二代酷睿系列处理器,搭载实时处理性能并扩充边缘 AI 产品矩阵
程控开关电源用于片心逻辑―Pentium Pro处理器
英特尔推出第二代酷睿处理器
最新的ARM技术以及嵌入式发展动态 下
嵌入式系统硬件接口设计 下
[转帖]IBM可编程网络处理器
马斯克展示特斯拉AI5处理器样片,口误感谢TSC而非台积电
英特尔研发 “统一核心” 架构处理器,招聘信息透露其将突破现有混合架构设计
基于GP4020的GPS接收机基带处理器电路
德国初创杀进 RISC‑V,首款通用处理器流片
英特尔和SambaNova将Xeon 6定位为人工智能推断目标
英特尔确认取消酷睿 Ultra 9 290K Plus 处理器,
嵌入式系统硬件接口设计 上
PoerPC处理器的BDM调试头原理图
常用嵌入式系统,处理器,开发工具分类(PDF)
LINUX 精华
对数压缩方式数字音频处理器(DAC76、MN5110)
AVR处理器上嵌入式Web Server
SRS效果处理器