贵宾登录

不用小核也很猛第12代酷睿Alder Lake-S同频性能测试

日期: 2024-05-20 07:52

  经过漫长的等待,英特尔在2021年底正式推出了第12代酷睿处理器AlderLake-S桌面版。AlderLake-S是英特尔首批大规模量产的10nm桌面版处理器,此前称之为10nmEnhancedSuperFin(现在重命名为Intel7,和业内的节点标准相匹配),这对英特尔来说意义重大,标志着其在轻薄本、游戏本、服务器、台式机等所有产品线都完成了工艺制程与微架构的全面换代,14nm和Skylake两位老朋友将彻底告别舞台......

  除了工艺制程的换代之外,AlderLake-S运用了众多新技术、支持很多新标准,最明显的特性就是采用了Hybrid混合架构设计,性能核也就是P-Core采用了GoldenCove微架构,能效核E-Core则是Gracemont,最多高规格为8+8核心/24线协议的支持,则标志着AlderLake-S平台整体的全面升级。

  首批上市的AlderLake-S高端产品均应用了Hybrid混合架构设计,也就是搭配了4到8个E-Core能效核,英特尔表示新一代能小核Gracemont旨在面对当今多任务场景做到充分优化,提高了吞吐量效率并提供可扩展的多线程性能。观察dieshot可以发现,4个Gracemont和1个GoldenCove大小相当,都占用了1个Ring节点,但4个Gracemont组成集群后多线个GoldenCove开启超线程之后更强,因此PPA角度上来看,Gracemont显然比GoldenCove要好得多,能在有限的硅片空间内实现更强的多核任务负载。

  AlderLake-S采用Hybrid混合架构设计则是兼顾了GoldenCove与Gracemont二者的共同有点,致力于做到单线程与多线程两个维度的全面提升。不过Hybrid混合架构设计和ARM的big.LITTLE相似,都需要软硬件的合理调度优化才能让性能最好发挥。为此AlderLake-S内置了英特尔硬件线程调度器ITD来进行引导,并针对最新Windows11操作系统进行优化设计,致力于在合适时间将恰当的线程置于相应的内核上,从而确保这两种全新内核微架构的无缝衔接。

  不过对于很多用户,尤其是游戏玩家来说,他们更关注AlderLake-S中性能核GoldenCove的表现,能小核Gracemont带来的多线程性能提升则是起到锦上添花的作用;甚至很多玩家还准备关闭能效核,在有限的功率和散热能力下将性能核超到更高的频率。PConline评测室针对第12代酷睿处理器AlderLake-S,除了综合性的首发评测之外,还针对性能核GoldenCove进行了单独测试。

  在性能测试开始前,我们先来简单回顾一下历史,英特尔在2014年(Tick年)底成功量产了14nm工艺制程,推出Broadwell家族的酷睿M系列产品,而在2015年(Tock年),Intel则利用良率逐步走向成熟的14nm工艺制程将Skylake微架构的第6代酷睿全面推向市场;而那几年AMD还在推土机泥潭中挣扎,Skylake甚至Haswell都能够做到酷睿i3默秒全......

  根据早期的路线图,如果英特尔能够持续延续Tick-Tock节奏,那么会在2016年(Tick年)量产10nm制程工艺的CannonLake(微架构继承Skylake),在2017年(Tock年)进行下一轮微架构升级,将IceLake推向市场......

  不过在当时,没人能预测到原定计划服役2-3年的Skylake微架构会在桌面平台被使用长达5年之久,由于10nm工艺制程的种种问题,且英特尔所遵循的“工艺制程与微架构相捆绑“原则,英特尔迟迟不能将新架构的产品推向桌面市场,第7代酷睿KabyLake-S、第8-9代酷睿CoffeeLake-S乃至第10代酷睿CometLake-S等一系列产品,虽然都有新的CodeName,但本质却都是Skylake微架构的马甲,内核IPC没有变化,主要是依靠增加核心线程数量,以及拉高核心睿频来获得性能提升。2021年初,面对AMDZen3的凌厉攻势,英特尔终于有所动作,将原本基于10nm节点设计SunnyCove微架构backport“反向移植”到14nm节点上进行生产,这就是代号为RocketLake-S的第11代酷睿处理器桌面版。

  不过客观来说RocketLake-S并不是一代很成功的产品,将为10nm节点设计的微架构反向移植到14nm节点上,势必会产生很多新问题。CypressCove微架构为了提高IPC,每核心的规模也就是晶体管数量相比Skylake微架构做到了显著增加,而采用低密度的14nm节点来生产,势必导致面积及功耗的增长。最终酷睿i9-11900K只有8核心16线线K还要更大,且满载功耗变得更高了.......

  虽然在桌面平台长期停滞于14nm节点,但英特尔近年来的微架构设计还是做到了稳步推进。在2020年后,英特尔推出的TigerLake系列第11代酷睿处理器移动版采用了WillowCove微架构,WillowCove相当于SunnyCove的小幅增强版,改进了缓存设计,每核心拥有更大容量的L2和L3缓存(IPC对比SunnyCove提升只有个位数,几乎可以忽略不计),并在10nmSuperFin技术的加持下频率大幅提升。而本篇文章的主角,第12代酷睿AlderLake-S采用性能核GoldenCove则是WillowCove的下一代升级版。

  前文提到过,AlderLake采用的P-Core性能核代号为GoldenCove,但不同于WillowCove对SunnyCove微调缓存式的小幅升级,GoldenCove是称得上Tock级别升级的全新微架构,整体的变化非常大,官方宣传称GoldenCove的设计目标旨在提高速度,突破低时延和单线程应用程序性能的限制,以及更好地支持代码体积较大的应用程序。

  为了进一步提高IPC,GoldenCove的设计宗旨是更宽、更深、更智能。微架构的前端解码器由4个增至6个,6µop缓存增至8µop。

  wideallocation分配由5路增至6路,执行端口由10个增至12个。具体到整数执行引擎部分,GoldenCove增加了第五个整数执行端口。

  矢量浮点执行部分,虽然没有增加端口,但额外添加了新的FADD加法计算单元。

  考虑到CypressCove对比Skylake已经有了超过两成的IPC提升,而GoldenCove在CypressCove的基础上又提升了19%的IPC,可以称得上百尺竿头更进一步!当然对于测试处理器微架构的IPC及提升幅度,变量其实不小,采用不同的测试平台(主板BIOS版本、内存频率和时序、缓存频率、操作系统),测试不同的应用项目,都会对测试结果产生显著的影响。

  比较遗憾的是,由于时间紧张,本次同频测试没有加入游戏性能的同频率对比;关注AlderLake-S游戏表现的玩家,可以关注PConline的综合性首发评测。

  通过BIOS将酷睿i9-12900K的所有E-Core能效核关闭,只保留8个性能核,最终规格为8核心16线K则关闭两个核心,也是保留8核心16线程。为了避免睿频调度的影响,三款处理器均锁频为全核心4.5GHz,Ring也就是缓存频率也锁定为4.3GHz。

  ROGMAXIMUSZ690EXTREME的BIOS界面和前几代产品基本相同,功能也是非常丰富的。测试前将XMP打开,内存频率为5200CL40-40-40-80,比JEDEC标准要略高一点;由于金士顿FURY16G×2DDR5-5200CL40是首批DDR5内存,因此它的频率并不是特别高,时序也不是很好看,希望明年DDR5逐步走向成熟后,出现频率更高时序更低的产品。

  另外在额外提一下,在ROGMAXIMUSZ690EXTREME主板的现有0702版BIOS中,当关闭所有E-Core能效核后,8个P-Core性能核是可以手动打开AVX-512的。就是不知道后续的版本BIOS会对AVX-512做出怎样的处理,有可能会直接屏蔽掉?而到了明年,像酷睿i5-12400这样的纯性能核产品正式发布后,又该如何处理AVX-512呢?我们将持续关注......

  纯性能模式下CPU-Z软件所识别的参数,分别是关闭AVX-512与开启AVX-512。

  先来看一下常见的Cinebench,作为基于Cinema4D开发的测试软件,Cinebench阴恻测试简单直观而广泛流行,目前已经跟随Cinema4D一起更新至R23版本。此前Cinebench是英特尔处理器的弱势项目,不但核心数量要比对位的AMD竞品少很多,并且同频性能也不占优势。

  而到了第12代酷睿AlderLake-S,针对Cinebench的同频性能有了很大的提升,实测在R20及R23版本中,GoldenCove对比第11代酷睿RocketLake-S的CypressCove单线%的提升,多线%,比官方宣布的IPC提升平均值19%还要高出几个百分点;而如果对比Skylake微架构,GoldenCove在R20和R23这两项做到了单线%,多线%,这个幅度非常恐怖!

  CPU-Z同样是流行的基准测试软件,包含不同的项目以分别调用处理器的不同指令集运行,测试时采用1.97版本。GoldenCove对比CypressCove的同频性能提升也超过20%,高于CypressCove对Skylake的提升幅度。

  V-Ray是由专业的渲染器开发公司CHAOSGROUP开发的渲染软件,是业界最受欢迎的渲染引擎。本次测试的是V-Ray4和V-Ray5两个版本的独立benchmark,显示GoldenCove对比CypressCove的同频性能提升都超过了22%。

  Blender是一款开源的跨平台全能三维动画制作软件,提供从建模、动画、材质、渲染、到音频处理、视频剪辑等一系列动画短片制作解决方案,目前最新版本为2.93.5,导入Classroom素材进行渲染,记录消耗时常。这项GoldenCove对比CypressCove同频提升也超过了20%。

  KeyShot意为“TheKeytoAmazingShots”,是一个互动性的光线追踪与全域光渲染程序,无需复杂的设定即可产生相片般线D渲染影像。目前也推出了独立的测试工具KeyShotViewerBenchmark,这项GoldenCove对比CypressCove同频提升同样超过了20%。

  CoronaRender渲染器是业界后起之秀,在渲染质量和速度上其实非常优秀,目前提供了Corona1.3Benchmark基准测试程序。GoldenCove在这项测试中表现一般,同频对比CypressCove提升只有11%左右。

  CPUProfile是3DMark新版推出的处理器性能测试项目,可测试处理器不同线程负载下的性能表现。此前CypressCove对比Skylake在CPUProfile场景中表现出色,不过GoldenCove在却在此项目中提升较为有限。

  PCMark10含有一整套全面的测试项,涵盖现代办公场所中的各种任务,是被广泛认可的计算机综合性能测试软件,除了处理器以外,内存、显卡、固态硬盘性能也会影响分数。运行PCMark应用程序测试项目(Office+Edge),GoldenCove对比CypressCove同频提升超过17%。

  ULProcyon是为专业用户打造的基准测试组件,目前推出了办公室生产力基准测试项目,使用微软Office应用程序来衡量电脑的办公生产力工作性能。该基准测试的特点是使用微软Word、Excel、PowerPoint和Outlook模拟真实的任务。GoldenCove对比CypressCove在此项目中同频提升超过18%。

  Crossmark是BAPCo组织开发的基准测试软件,覆盖创造力、生产力和响应速度三大维度,对处理器的单线程性能有很高要求。此项测试中GoldenCove对CypressCove的同频提升达到15%。

  y-cruncher是一款计算圆周率的软件,能够较好的利用AVX-512指令集及其拓展,同时也对内存的带宽提出很高要求。得益于DDR5内存更高的带宽,即便不开启AVX-512,只是用AVX2的执行文件,GoldenCove的多线程计算效率也会更强。当然,如果BIOS里选择开启AVX-512,提升还会更加显著。

  如果跨度更大一些,与当前英特尔桌面平台处理器中存量最高的Skylake微架构去对比,GoldenCove在以上这些常用基准测试中可以获得30-50%的同频性能提升。因此对于使用第8代-第10代酷睿的用户来说,即便完全不考虑能效核Gracemont,只看性能核GoldenCove的IPC表现,第12代酷睿处理器AlderLake-S的升级幅度依旧是巨大的。

  在2021年,历经磨难的10nm工艺制程在良率和产能方面逐渐走上正规,同时频率也能做到了5.0GHz以上,不再是拖后腿的存在,能够在各个产品线nm的全面取代。而微架构方面经过了Skylake到CypressCove再到GoldenCove的两次进化,IPC效率提升显著,彻底摆脱了“高频低能”的尴尬境况。再结合Gracemont能效核带来的多线代酷睿处理器桌面版AlderLake-S可以称得上一次全面的换代升级。

  在帕特·基辛格回归后,英特尔提出了非常激进的路线图规划,我们也期待英特尔能够加快产品开发进度,让未来新品的微架构设计和工艺制程都获得持续更新,不要让2015-2020年期间祖传14nmSkylake的历史再一次上演......

  英特尔发布第12代酷睿HX处理器:不断超越,助力2022移动PC再攀性能高峰!