超能课堂(290)：处理器是如何从单核演化到64核的（2）

发布人：超能网时间：2021-10-21 来源：工程师发布文章

首款六核处理器：Core i7-980X

2010年3月16日推出的Core i7-980X是首款6核处理器，核心代号Gulftown，它基于Westmere架构，也就是Nehalem的32nm版本，所以也继承了整合三通道内存控制器、QPI总线、Turbo Boost以及重新启用的超线程技术，处理器每核心拥有256KB L2缓存，共享12MB L3缓存，主频是3.33GHz，最高睿频3.6GHz。

由于X58属于HEDT平台，所以Gulftown六核其实也没几款，前后一共才出了四颗，售价也高高在上，对市场影响有限，但它的存在是给对手六核Phenom II X6的一个降维打击，性能远超对手，发布也比你早一个月，用的工艺也比你先进一代，在当时，从CPU技术上讲，AMD彻底失去了“话语权”，当然了如果说对市场的影响，便宜的Phenom II X6比高价的Core i7-980X要大多了。

首款八核处理器：AMD FX-8100系列

其实说2011年AMD推出的Bulldozer推土机是首款八核处理器估计会有很大争议，因为它是一个模块化的CPU，每个模块内有2个整数单元和1个高度共享的浮点单元，AMD的FX系列处理器最多拥有4个这样的模组，而AMD将每个整数单元都视为一个核心，所以FX-8100系列也成为世界上首款原生8核桌面CPU。

当然了，推土机处理器的性能有多糟糕我已经不想再提了，当年关于AMD FX系列处理器是否是“真8核”很多玩家与AMD之间出现争议，一些玩家甚至认为AMD涉嫌非法宣传，将AMD告上了法庭，最后这官司还赢了，AMD因此而吃了罚单。

首发的FX-8100系列有五个型号，最高加速频率是4.5GHz，每个模组共享2MB L2缓存，所有核心共享8MB L3缓存，TDP有95W和125W两种。一年后推出的Piledriver打桩机处理器则是推土机的改良版本，不过性能其实也没高多少，FX-8300系列一共有7个型号，最高加速频率降至4.3GHz，TDP同样是95W或125W，不过嘛，还有FX-9590和FX-9370两个标配一体式水冷散热器的奇特产品，他们的TDP高达220W，前者最高加速频率达到了5GHz，后者也有4.7GHz，当年是AMD追高频追得比较疯狂。

其实推土机一共有四代架构，除了上面已经提到的推土机和打桩机之外，还有Steamroller压路机以及Excavator挖掘机，但AMD在推出打桩机后就放弃了与Intel在高端平台上的争夺市场，后面两种架构只出现在APU上。

而桌面市场的第一颗真八核处理器是Intel在2014年推出Core i7-5960X，属于22nm的Haswell-E架构，基础频率3GHz，最高睿频3.5GHz，拥有20MB L3缓存，是用HEDT的X99平台上的，999美元的高昂售价也让许多玩家望而却步。

至于主流平台的八核处理器，则是2017年AMD Zen架构的第一代Ryzen 7系列处理器，是它正式引发了Intel与AMD在处理器市场上的核心数量大战。

首款十核处理器：Core i7-6950X

Intel在2016年5月发布的Core i7-6950X是首款桌面的十核处理器，它所用的Broadwell-E架构其实就是Haswell-E的制程升级版，生产工艺从22nm升级到14nm，核心数量从上代Core i7-5960X的8核增加到10核，晶体管数量也从26亿增加到32亿，但因为更先进的制程工艺，芯片面积从355.52mm2缩减到246mm2。

除了核心数量与制程之外，Core i7-6950X与Core i7-5960X的区别其实不算大，L3缓存容量增加到25MB，基础频率依然是3.0GHz，最大睿频2.0频率3.5GHz，但在这一代处理器Intel引入了Turbo Boost Max 3.0技术，最高单核睿频能到4.0GHz，此外支持DDR4的频率也从2133MHz提升到2400MHz，但这个对于X99主板来说意义不大。

而主流市场的10核处理器直到2020年5月才到来，它就是Core i9-10900K，目前市场上就Comet Lake这一代有10核的产品，最新一代的Rocket Lake最多就只有8核，AMD的Zen 2因为架构问题8核以上只能出12核或16核的产品，而Zen 3理论上是能出10核或者14核的，但AMD可能觉得没必要所以没出。

Intel Skylake-X：12/14/16/18核一同到来

在2017年6月份，Intel推出了第七代Core X系列处理器，不过这代产品有点奇葩，有Skylake-X与Kabylake-X两种不同架构的处理器，当中Kabylake-X可以说是非常坑，所以后续也没有类似的产品了，而Skylake-X则与以往HEDT产品一样源于服务器处理器。

与上一代X99平台的Broadwell-E处理器相比，Skylake-X处理器多了12核、14核、16核、18核的产品，并且用Core i9取代Core i7成为Intel消费级市场上最强处理器的代名词。

Skylake-X与主流级的Skylake相比，缓存结构有了明显的调整，L2缓存从每核心256KB提升到1MB，L3则从每核心共享2MB变成了1.375MB，这样做可以提升L2的命中率降低访问延迟，提升IPC。此外网状总线取代了环形总线，这样有利于拓扑更多核心数量，AVX-512指令集也是从这代架构开始引入的。Turbo Boost MAX 3.0从Broadwell-E的只能提升单核频率变成最多可以提升两个核心的频率，但频率提升幅度没以前那么大。

第7、9、10代Core X处理器都是用Skylake-X架构的，虽然第10代的代号改成了Cascade Lake，但本质上就是Skylake-X，就多了4条PCI-E通道并且强化了AI性能。

不过实际上第一个上市的12核和16核处理器是AMD的锐龙Threadripper 1920X和1950X，他们在2017年8月份就上市了，而Intel只是在6月份纸面发布了第七代Core X系列处理器，7月份首批上市的只有10核及以下的产品，12和到18核的产品要等到10月份才上市。

在2019年，AMD推出了Zen 2架构的锐龙3000系列处理器，把12核与16核处理器推向了主流市场。

Ryzen Threadripper系列：24/32甚至64核

实际上这些年挑起核心数量大战的不是Intel，而是AMD，他们在第一代EPYC上玩起MCM之后就一发不可收拾，而基于EPYC的锐龙Threadripper自然也这样，第一代锐龙Threadripper处理器最大核心数量只有16，而到了2018年发布的第二代锐龙Threadripper，最大核心数量直接翻倍到32。

锐龙Threadripper 2990WX

锐龙Threadripper 2000系列处理器采用12nm Zen+内核，分为WX系列和X系列，X系列和第一代是一样的，只有两个内核可工作的内部双路系统，最大核心数16个，而WX系列则是四个内核都可工作的，和服务器的EPYC一样内部是四路互联，最大核心数32个。

核心之间采用25GBps的Infinity Fabric总线互联，只有核心0和核心2提供内存控制器和PCI-E控制器，于核心1和核心3是没有直接连接内存和PCI-E的，锐龙Threadripper 2970WX/2990WX只能工作在NUMA模式，这核心1/3的通信延迟明显高于核心0/2，所以会限制这两个核心的性能。

锐龙Threadripper 3990X

到了Zen 2架构的锐龙Threadripper 3000，CPU被拆分成CCD计算核心和IOD输入输出核心，所有的内存、PCI-E、USB、SATA控制器转移到了IOD上，CCD与IOD之间采用第二代Infinity Fabric总线连接，这样延迟虽然会有所增加，但是很好的解决了每个核心之间访问内存和PCI-E时延迟不一的问题，并且每个IOD最多可连接8个CCD，于是就有了64核的锐龙Threadripper 3990X。

Intel Lakefield：开启混合架构新时代的五核处理器

Intel的Lakefield项目其实在2019年就正式公开了，而产品正式上市是2020年，这款产品的实验性质很重，它是首款采用Intel Foveros 3D堆叠工艺的产品，也是首款采用混合架构的x86处理器。

Lakefield SoC至少包含四个层，顶部两层是由PoP封装的DRAM内存所组成，由两块BGA DRAM堆叠在一起，第三层则是由10nm工艺打造的CPU与GPU，最底层则是由22nm工艺打造的I/O与缓存层。

10nm工艺的计算芯片包含一个Sunny Cove大核，独享512KB L2缓存，四个Tremont小核，它们共享1.5M L2缓存，所有核心共享4MB的L3缓存，内存控制器是4*16位的，支持LPDDR4，整合了Gen 11核显，有64个EU单元，Gen 11.5显示控制器还有新的IPU，支持DP 1.4。

Lakefield家族只有Core i5-L16G7和Core i3-L13G4两款产品，两者的主要区别的是频率以及核显的EU数量，只有少数轻薄本用了这款处理器，性能表现其实还不错，5W的Core i5-L16G7甚至可以与15W的Core i5-10210U叫板。

在经过Lakefield的小规模实验后，Intel的混合架构将会在这个月底发布的Alder Lake处理器上开花结果，大家可以期待桌面满血的混合架构x86处理器到底会怎么样的表现，而Foveros 3D堆叠工艺也会用在未来的Xe-HPC服务器计算卡上。

展望未来

在可预见的将来，桌面市场的最大核心数量依然会维持在64核，因为Intel和AMD的新一代HEDT处理器完全没有消息，但从两家最新的服务器处理器来看，Intel的最多不会超过40核，而AMD最多也是64核，Intel把双芯Xeon下放到HEDT平台可能性非常小，主要看点还是AMD未来的Zen 4，有消息说Zen 4架构的EPYC处理器最多能到96核，但是否会下放到HEDT平台这就不太确定了。

主流平台方面，目前的消息是代号为Raphael的Zen 4处理器最高配置依然为16核，Intel方面下一代的Raptor Lake则最多24核，但是由16个E-Core加8个P-Core所组成的，也就是说最多32线程，线程数和Zen 4的16核保持一致，但这些都不是实锤的消息，还有很大不确定性。

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。