博客专栏

EEPW首页 > 博客 > 超能课堂(290):处理器是如何从单核演化到64核的(2)

超能课堂(290):处理器是如何从单核演化到64核的(2)

发布人:超能网 时间:2021-10-21 来源:工程师 发布文章

首款六核处理器:Core i7-980X

2010年3月16日推出的Core i7-980X是首款6核处理器,核心代号Gulftown,它基于Westmere架构 ,也就是Nehalem的32nm版本,所以也继承了整合三通道内存控制器、QPI总线、Turbo Boost以及重新启用的超线程技术,处理器每核心拥有256KB L2缓存,共享12MB L3缓存,主频是3.33GHz,最高睿频3.6GHz。

5.jpg

由于X58属于HEDT平台,所以Gulftown六核其实也没几款,前后一共才出了四颗,售价也高高在上,对市场影响有限,但它的存在是给对手六核Phenom II X6的一个降维打击,性能远超对手,发布也比你早一个月,用的工艺也比你先进一代,在当时,从CPU技术上讲,AMD彻底失去了“话语权”,当然了如果说对市场的影响,便宜的Phenom II X6比高价的Core i7-980X要大多了。

首款八核处理器:AMD FX-8100系列

其实说2011年AMD推出的Bulldozer推土机是首款八核处理器估计会有很大争议,因为它是一个模块化的CPU,每个模块内有2个整数单元和1个高度共享的浮点单元,AMD的FX系列处理器最多拥有4个这样的模组,而AMD将每个整数单元都视为一个核心,所以FX-8100系列也成为世界上首款原生8核桌面CPU。

6.jpg

当然了,推土机处理器的性能有多糟糕我已经不想再提了,当年关于AMD FX系列处理器是否是“真8核”很多玩家与AMD之间出现争议,一些玩家甚至认为AMD涉嫌非法宣传,将AMD告上了法庭,最后这官司还赢了,AMD因此而吃了罚单。

首发的FX-8100系列有五个型号,最高加速频率是4.5GHz,每个模组共享2MB L2缓存,所有核心共享8MB L3缓存,TDP有95W和125W两种。一年后推出的Piledriver打桩机处理器则是推土机的改良版本,不过性能其实也没高多少,FX-8300系列一共有7个型号,最高加速频率降至4.3GHz,TDP同样是95W或125W,不过嘛,还有FX-9590和FX-9370两个标配一体式水冷散热器的奇特产品,他们的TDP高达220W,前者最高加速频率达到了5GHz,后者也有4.7GHz,当年是AMD追高频追得比较疯狂。

其实推土机一共有四代架构,除了上面已经提到的推土机和打桩机之外,还有Steamroller压路机以及Excavator挖掘机,但AMD在推出打桩机后就放弃了与Intel在高端平台上的争夺市场,后面两种架构只出现在APU上。

而桌面市场的第一颗真八核处理器是Intel在2014年推出Core i7-5960X,属于22nm的Haswell-E架构 ,基础频率3GHz,最高睿频3.5GHz,拥有20MB L3缓存,是用HEDT的X99平台上的,999美元的高昂售价也让许多玩家望而却步。

至于主流平台的八核处理器,则是2017年AMD Zen架构的第一代Ryzen 7系列处理器,是它正式引发了Intel与AMD在处理器市场上的核心数量大战。

首款十核处理器:Core i7-6950X

Intel在2016年5月发布的Core i7-6950X是首款桌面的十核处理器,它所用的Broadwell-E架构其实就是Haswell-E的制程升级版,生产工艺从22nm升级到14nm,核心数量从上代Core i7-5960X的8核增加到10核,晶体管数量也从26亿增加到32亿,但因为更先进的制程工艺,芯片面积从355.52mm2缩减到246mm2。

除了核心数量与制程之外,Core i7-6950X与Core i7-5960X的区别其实不算大,L3缓存容量增加到25MB,基础频率依然是3.0GHz,最大睿频2.0频率3.5GHz,但在这一代处理器Intel引入了Turbo Boost Max 3.0技术,最高单核睿频能到4.0GHz,此外支持DDR4的频率也从2133MHz提升到2400MHz,但这个对于X99主板来说意义不大。

7.jpg

而主流市场的10核处理器直到2020年5月才到来,它就是Core i9-10900K,目前市场上就Comet Lake这一代有10核的产品,最新一代的Rocket Lake最多就只有8核,AMD的Zen 2因为架构问题8核以上只能出12核或16核的产品,而Zen 3理论上是能出10核或者14核的,但AMD可能觉得没必要所以没出。

Intel Skylake-X:12/14/16/18核一同到来

在2017年6月份,Intel推出了第七代Core X系列处理器,不过这代产品有点奇葩,有Skylake-X与Kabylake-X两种不同架构的处理器,当中Kabylake-X可以说是非常坑,所以后续也没有类似的产品了,而Skylake-X则与以往HEDT产品一样源于服务器处理器。

与上一代X99平台的Broadwell-E处理器相比,Skylake-X处理器多了12核、14核、16核、18核的产品,并且用Core i9取代Core i7成为Intel消费级市场上最强处理器的代名词。

8.jpg

Skylake-X与主流级的Skylake相比,缓存结构有了明显的调整,L2缓存从每核心256KB提升到1MB,L3则从每核心共享2MB变成了1.375MB,这样做可以提升L2的命中率降低访问延迟,提升IPC。此外网状总线取代了环形总线,这样有利于拓扑更多核心数量,AVX-512指令集也是从这代架构开始引入的。Turbo Boost MAX 3.0从Broadwell-E的只能提升单核频率变成最多可以提升两个核心的频率,但频率提升幅度没以前那么大。

第7、9、10代Core X处理器都是用Skylake-X架构的,虽然第10代的代号改成了Cascade Lake,但本质上就是Skylake-X,就多了4条PCI-E通道并且强化了AI性能。

不过实际上第一个上市的12核和16核处理器是AMD的锐龙Threadripper 1920X和1950X,他们在2017年8月份就上市了,而Intel只是在6月份纸面发布了第七代Core X系列处理器,7月份首批上市的只有10核及以下的产品,12和到18核的产品要等到10月份才上市。

在2019年,AMD推出了Zen 2架构的锐龙3000系列处理器,把12核与16核处理器推向了主流市场。

Ryzen Threadripper系列:24/32甚至64核

实际上这些年挑起核心数量大战的不是Intel,而是AMD,他们在第一代EPYC上玩起MCM之后就一发不可收拾,而基于EPYC的锐龙Threadripper自然也这样,第一代锐龙Threadripper处理器最大核心数量只有16,而到了2018年发布的第二代锐龙Threadripper,最大核心数量直接翻倍到32。

9.jpg

锐龙Threadripper 2990WX

锐龙Threadripper 2000系列处理器采用12nm Zen+内核,分为WX系列和X系列,X系列和第一代是一样的,只有两个内核可工作的内部双路系统,最大核心数16个,而WX系列则是四个内核都可工作的,和服务器的EPYC一样内部是四路互联,最大核心数32个。

核心之间采用25GBps的Infinity Fabric总线互联,只有核心0和核心2提供内存控制器和PCI-E控制器, 于核心1和核心3是没有直接连接内存和PCI-E的,锐龙Threadripper 2970WX/2990WX只能工作在NUMA模式,这核心1/3的通信延迟明显高于核心0/2,所以会限制这两个核心的性能。

10.jpg

锐龙Threadripper 3990X

到了Zen 2架构的锐龙Threadripper 3000,CPU被拆分成CCD计算核心和IOD输入输出核心,所有的内存、PCI-E、USB、SATA控制器转移到了IOD上,CCD与IOD之间采用第二代Infinity Fabric总线连接,这样延迟虽然会有所增加,但是很好的解决了每个核心之间访问内存和PCI-E时延迟不一的问题,并且每个IOD最多可连接8个CCD,于是就有了64核的锐龙Threadripper 3990X。

Intel Lakefield:开启混合架构新时代的五核处理器

Intel的Lakefield项目其实在2019年就正式公开了,而产品正式上市是2020年,这款产品的实验性质很重,它是首款采用Intel Foveros 3D堆叠工艺的产品,也是首款采用混合架构的x86处理器。

11.jpg

Lakefield SoC至少包含四个层,顶部两层是由PoP封装的DRAM内存所组成,由两块BGA DRAM堆叠在一起,第三层则是由10nm工艺打造的CPU与GPU,最底层则是由22nm工艺打造的I/O与缓存层。

10nm工艺的计算芯片包含一个Sunny Cove大核,独享512KB L2缓存,四个Tremont小核,它们共享1.5M L2缓存,所有核心共享4MB的L3缓存,内存控制器是4*16位的,支持LPDDR4,整合了Gen 11核显,有64个EU单元,Gen 11.5显示控制器还有新的IPU,支持DP 1.4。

Lakefield家族只有Core i5-L16G7和Core i3-L13G4两款产品,两者的主要区别的是频率以及核显的EU数量,只有少数轻薄本用了这款处理器,性能表现其实还不错,5W的Core i5-L16G7甚至可以与15W的Core i5-10210U叫板。

在经过Lakefield的小规模实验后,Intel的混合架构将会在这个月底发布的Alder Lake处理器上开花结果,大家可以期待桌面满血的混合架构x86处理器到底会怎么样的表现,而Foveros 3D堆叠工艺也会用在未来的Xe-HPC服务器计算卡上。

展望未来

在可预见的将来,桌面市场的最大核心数量依然会维持在64核,因为Intel和AMD的新一代HEDT处理器完全没有消息,但从两家最新的服务器处理器来看,Intel的最多不会超过40核,而AMD最多也是64核,Intel把双芯Xeon下放到HEDT平台可能性非常小,主要看点还是AMD未来的Zen 4,有消息说Zen 4架构的EPYC处理器最多能到96核,但是否会下放到HEDT平台这就不太确定了。

主流平台方面,目前的消息是代号为Raphael的Zen 4处理器最高配置依然为16核,Intel方面下一代的Raptor Lake则最多24核,但是由16个E-Core加8个P-Core所组成的,也就是说最多32线程,线程数和Zen 4的16核保持一致,但这些都不是实锤的消息,还有很大不确定性。

*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。



关键词: 处理器

相关推荐

技术专区

关闭