博客专栏

EEPW首页 > 博客 > Alder Lake处理器深入把玩:双内核效能对比,未来移动版性能预览

Alder Lake处理器深入把玩:双内核效能对比,未来移动版性能预览

发布人:超能网 时间:2021-12-19 来源:工程师 发布文章

其实自Intel Alder Lake处理器要用x86混合架构的消息传出,与之相关的争论就没停过,争论的重点基本上都在桌面处理器有没有必要用E-Core这一点,对于移动处理器来说,E-Core确实挺有用的,毕竟笔记本的体积是有限的,要控制发热量,而且还需要考虑续航问题,降低发热和功耗这正是E-Core在行的。但台式机的散热器大得多,处理器的热功耗设计和笔记本相比可以大许多, 也不需要太过在意节能的问题。

1.jpg

那么为什么Intel还要在Alder Lake-S里面塞E-Core呢?Alder Lake所用的P-Core也就是Golden Cove的IPC与频率都很高,有着很强的单线程性能,而想提升多线程性能的话就需要堆砌大量的P-Core,不过P-Core的核心面积实在是太大了,堆太多的话发热太大就会影响频率。还有就是芯片面积的问题,下一代Xeon可扩展处理器Sapphire Rapids单个芯片里面就有15个Golden Cove,根据Intel的资料它的芯片面积大约是400mm2,这尺寸肯定不能直接扔主流消费市场。

那么如果确保处理器有足够的单线程性能,又在不大幅增加芯片面积的情况下增加多线程性能呢?Intel给出的答案就是混合架构的Alder Lake,在此架构里P-Core的目的是提升处理器的单线程性能,而E-Core的设计目的则是用更低的功耗来提升多线程性能,因为E-Core相当省晶体管,大概4个E-Core的芯片面积才和1个P-Core这么大。

2.jpg

这里直接借用一下@Locuza_做的图

从上图可以看到,1个E-Core的芯片面积大概1.7mm2,而4个E-Core加上2MB L2缓存的面积是8.78mm2,只是略大于一个P-Core加上它的1.25MB L2缓存,但根据官方的说法,4个E-Core所提供的多线程性能是要远高于1个开启超线程的P-Core的,所以桌面的Alder Lake-S上那8个E-Core的主要作用确实是用来拉高处理器的多线程性能的,节能作用只是其次。

3.jpg

桌面版Alder Lake-S的8P+8E组合是Alder Lake里面核心数量最多的,移动版的Alder Lake-P最多只有6P+8E,但核显的规模增大,并且增加了Thunderbolt 4控制器和IPU图像处理单元,低功耗移动版更是只有2P+8E,而下一代的Raptor Lake处理器更是打算把E-Core数量增加到16个 ,看来这E-Core是真的好用,而且堆起来性价比也很高。

其实我们在首测的时候是想单独测试P-Core和E-Core的性能的,但实际上只能单独把E-Core完全关闭,P-Core至少得保留一个,所以那时候就没关于E-Core的测试,现在我们换个思路,来试下不同P-Core和E-Core的组合会对性能有什么影响。

测试平台与说明

4.png

测试平台就是同步评测那套,使用Core i9-12900K处理器,华硕ROG MAXIMUS Z690 HERO主板,两条16GB芝奇RIPJAWS S5 DDR5-5200内存,时序是CL40-40-40-76,显卡是NVIDIA GeForce RTX 3090 Founder Edition。这次测试是通过关闭Core i9-12900K的P-Core和E-Core来验证不同核心组合性能,我们并不会处理器的频率做任何改动,如果没特殊说明的话就是默认解锁功耗限制,这次只是一个验证性的测试,所以测试的项目会比首发评测少很多。

Core i9-12900K默认的睿频设置请看下表:

5.png

验证一:4P和2P+8E谁更强

为什么会选这样的组合来测呢?因为4个E-Core的芯片面积和1个P-Core大致相同,Intel也说过2个P-Core加8个E-Core的多线程性能是比4个P-Core更好的,所以我们就来验证一下,附带测下1 P-Core+8 E-Core以及1 P-Core+4 E-Core的组合。

理论测试

6.png7.png8.png9.png

单纯看各个测试的多线程测试的话,2P+8E的组合多线程性能是要比4P更强的,毕竟核心线程数量差距摆在那里,两个P-Core多线程性能确实不如8个E-Core,甚至1P+8E的多线程性能也和4P差不多。

但认真去看这些数据的话,你会发现只剩1个P-Core时单线程性能是明显下降了的,这可能与Windows的显存辅助均衡调度算法有关。

此外看3DMark CPU Profile的测试结果,4个P-Core在4线程和8线程时得分是要比2P+8E要高的,单线程性能相同,双线程的结果可能是单纯的测试误差,说明在8个线程内P-Core其实要比2P+8E更强,只有在两个都是最大线程时多线程性能才会拉开差距。

其实如果光看多线程性能的话,8个E-Core是肯定要比2个P-Core更好的,两者的芯片面积也差不多,那在有限尺寸的晶圆上全堆E-Core多线程性能不是更好?更何况Gracemont架构本身是支持超线程的,只不过在Alder Lake里面它是E-Core没这个必要所以没开而已,事情肯定没这么简单,不然Intel也不会画这么大力气去搞个混合架构了。

游戏性能

10.png

消费级处理器在绝大部分情况下都不会全线程一齐负载的,单线程性能有多重要这个游戏就会告诉你,测试的4个游戏里面4P与2P+8E在《全面战争:三国》和《Far Cry 6》帧数差距不大,但《古墓丽影:暗影》与 《银河破碎者》里2P+8E就明显落后4P很多,如果进一步削减P-Core数量的话性能下降得更厉害,1P+8E的游戏性能与2P+8E差很多,1P+4E的性能下降幅度反而没那么大。

很明显,E-Core在游戏里面帮不上太大的忙,主要还是得看单线程性能强得多的P-Core,就如Intel在架构日上所说的那样,P-Core是用来提供单线程性能的,而E-Core则是在尽量节能的情况下提升多线程性能。

功耗测试

11.png12.png

虽然我没对Core i9-12900K的频率进行改动,但因为睿频的关系它在不同核心数量时频率还是不一样的,核心数量越少全核频率就越高,这会对CPU的功耗带来微妙的影响,但整体来说还是关闭核心带来的影响更大,4个P-Core的功率是要比2个P-Core加8个E-Core功耗高8%的,后者的组合带来的多线程提升反而更大一点,怪不得Intel下一代产品还要继续增加E-Core数量。

2P+8E跑FPU的功耗是112W,而1P+8E则是84W,大致可推算出一个P-Core的功耗是28W,而1P+4E的功耗是60W,大致可推算出一组4个E-Core的功耗是24W,当然这只是大致的推算,并不是十分准确的数值,但依然看得出E-Core在能耗方面确实要比P-Core好不少。

验证二:超线程有多大作用

由于Core i9-12900K是16核24线程的,然后你会发现把E-Core关闭或者把P-Core的超线程关闭的话都会变成16线程,只是这16线程的组成成分不太一样,下面就来对比一下这两个组合的性能,并且会放上完整的Core i9-12900K的成绩作为参照。

理论测试

13.png14.png15.png16.png

基本上这三种组合单线程性能没多大差别,多线程性能大部分情况下8P+8E 16T是要优于8P 16T的,毕竟多了8个物理核心怎么都比8个逻辑核心要强,当然7-Zip的解压缩测试是个例外,只有这里8P 16T是要比8P+8E 16T更强的。

3DMark CPU Profile这个分线程数的测试我们能看出更多有趣的事,8P 16T在4线程和8线程的成绩是要远比8P+8E 16T和8P+8E 24T更低的,2线程时也略微低一些,这很有可能是线程调用出了问题,在E-Core开启的时候线程被正确分配到P-Core上,没有调用到虚拟的逻辑核心,但在只有P-Core的时候调度可能出了问题,线程被分配到逻辑核心上,导致性能明显下降。

16线程时8P 16T的得分也是低于8P+8E 16T的,不过这就不是线程调度的原因了,单纯是8个E-Core性能比8个P-Core超线程弄出来的逻辑核心性能更强。8P+8E 16T在8线程和16线程时性能比8P+8E 24T好一点,这是因为P-Core在关闭超线程后全核频率从4.8GHz提升到4.9GHz,而且我们可以从16线程的得分看出此时Core i9-12900K是优先使用E-Core来进行负载的,而不是使用P-Core的超线程。

游戏性能

17.png

这三个组合的游戏性能差别倒是不大,毕竟P-Core数量管够,硬要说的话就是关闭超线程后性能会高那么一点点,因为这种情况下P-Core的全核频率更高,关闭超线程也对CPU的单线程性能有轻微提升,但不怎么明显就是了。

功耗测试

18.png19.png

Core i9-12900K在华硕ROG Z690 Hero主板上跑AIDA 64 FPU AVX2负载时功耗是242W,关闭全部E-Core的话功耗会降低到213W,而关闭超线程的功耗则是214W,两者的功耗如此接近比较意外的,当然了两者的温度其实相差很远,关闭E-Core后会让热量更为集中,就算用360一体式水冷也很难压住,关闭超线程的话会降低P-Core的发热,让CPU温度下降到只有70多度。

验证三:预测下未来的移动版Alder Lake

移动版的Alder Lake-P会在明年1月的CES上发布,和桌面版Alder Lake-S相比,核显的EU单元从32个增加到96个,而CPU则从8P+E8变成了6P+8E,核显规模我们没法模拟,但CPU性能我们可以通过减少两个P-Core和限制CPU的PL1和PL2功耗进行模拟,当然了,Core i9-12900K的L3缓存应该会比移动版处理器多6MB,这个就没办法了。

这个测试里面我们会把Core i9-12900K关到6P+8E的状态,会分别测试解锁功耗以及把功耗限制到PL2=105W,PL1=45W,Tau=56秒的性能,这功耗限制是我们根据现在的11代酷睿H45处理器来设定的,未来的Alder Lake H45的标准功耗估计也差不多这样,而测试解锁功耗限制的是单纯想看看这种核心组合的性能上限,毕竟不少游戏本也会把处理器的PL1和PL2值设置到很高,当然性能肯定会和我们现在用桌面处理器模拟有一定差距。

理论测试

20.png21.png22.png23.png24.png

从各个测试来看,单线程性能基本没太大影响,毕竟只有单线程辅助时根本摸不到PL2的105W,基本可以满血跑完所有的测试。多线程的话,如果不限制功耗,6P+E8依然会比8P+8E性能下降10%~20%,加上功耗限制影响就大了,像CPU-Z这样的短时间测试性能降幅不会很明显,因为都在PL2的时间范围内,而R23这种10分钟以上的长时间测试,只有56秒的PL2就可以忽略不计了,绝大部分时间都只有45W,性能降幅相当明显。

但换个角度去看,Core i9-12900K关掉两个核后FPU烤机功率是175W,把它限制成只有45W的话依然能发挥出原本60%的性能,Alder Lake架构以及Intel 7工艺在能耗方面确实做得很不错。

游戏性能

25.png

把Core i9-12900K关两个P-Core游戏性能影响不大,也就《银河破碎者》这个比较吃CPU的有一点下降,限制功耗后,有三款游戏大概有10%的帧率下降,《全面战争:三国》这游戏这么吃CPU性能居然没变我是比较惊讶的。

从测试结果来看未来的移动版Alder Lake处理器性能还是比较不错的,在限制了功耗的情况下最差情况下依然有Core i9-12900K的一半性能,如果负载较轻时会发挥出更佳性能,当然实际在笔记本上肯定会被散热设计以及搭配的内存影响性能发挥,我们的测试只是大致模拟。

总结

简单归纳一下这次测试,Alder Lake里面的一个P-Core和四个E-Core芯片面积接近,四个E-Core的多线程性能大概比一个P-Core高出10~15%,而且功耗要低15%左右,在提升多线程性能和降低功耗方面,E-Core功不可没,所以Intel下一代的Raptor Lake打算继续堆E-Core来提升多线程性能。

当然了,只有E-Core是肯定不行的,因为E-Core的IPC只比Skylake好一点,而且它的频率并不算高,实践证明P-Core数量太少的话会严重影响游戏性能,至于需要多少个P-Core那就得看游戏需求了,每个主线程能分到一个独立的P-Core那当然是最好的状态,Alder Lake以及Raptor Lake最多8个P-Core的设计Intel肯定是在多年的数据收集后统计出来的。

关闭P-Core的超线程对Core i9-12900K来说大概会让多线程性能降低10~30%,具体数值得看负载是什么,不过可以确定的是在16线程内的负载是不会造成任何影响的,只有在需要调用超过16线程时才会动用到逻辑核心,关闭超线程的话可以让CPU的温度与功耗大幅降低,这也是解决Core i9-12900K温度过高的其中一个方法,当然不怎么建议这么做就是,限制功耗同样可以达到降温的目的,而且性能损失没那么大。

在对未来移动版的Alder Lake处理器的模拟当中,我们可以看出这处理器的能耗比其实是相当棒的,在关闭两个核心并且限制PL1=45W后,此时满载功耗只有原来的18.5%,它依然能发挥出接近Core i9-12900K至少50%的多线程性能,而游戏性能方面至少有80%,明年的Alder Lake-P移动处理器是相当值得期待的。

*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。



关键词: CPU

相关推荐

技术专区

关闭