终于呀,Intel 12 代 CPU 终于上市,我个人是相当的期待牙膏厂逆袭 AMD,这次最特别的地方莫过于引入了 P-Core 与 E-Core 搭配的设计,理论上可以更有效地分配运算资源,达到更节能且高性能的目的。
其中我觉得,这也是 PC 处理器一个相当大的转折点,第一次在同颗处理器内放入不同架构的处理核心,而这也是我最有兴趣的部分。而对于一般用户来说,最大的体验差别莫过于游戏的顺畅度与剪片输出的速度差异了吧!
简介 - Alder Lake 架构
第 12 代引入了异质架构设计,也就是俗称的大小核。大核是 Performance Core 使用的是 Golden Cove 微架构;Efficient Core 使用的是 Gracemont 微架构,是一款从 Atom 低功耗架构那延伸出来的产品,但是它不像以前的那陀 Atom,它的性能是能够与以往的 Skylake 微架构匹敌的,也就是之前 Intel 第 6 / 7 / 8… 代的 CPU 架构。
虽说 Intel 一直说 P-Core 与 E-Core 并不是大小核设计,但其实就是差不多的东西。只是这小核不是 ARM A55 这种 “小” 核心级别的,比较像是 Cortex-X1 与 Cortex-A78 的差距。也就是 “超大” 核心搭配 “大” 核心。由于多了这个架构,因此作业系统 Schedular 的设计与效率会大大的影响处理器效率,这个等一下我们会深入探讨。
而之所以 Intel 这次可以挤出这么大一管牙膏,除了 P-Core 与 E-Core 外,最重要的就是将 Intel 7 製程导入,你可以把它视同为台积电的 7nm 製程等级。在能耗降低的情况下,能大幅拉抬处理器性能表现。这次 i9-12900K 搭载了 8 颗 P-Core,以及 8 颗 E-Core。而 i5-12600K 则 6 颗 P-Core 搭配 4 颗 E-Core,所以 P / E-Core 的搭配究竟对使用上有没有加分呢?我们等一下告诉你。
简介 - 第 12 代 CPU 测试平台
首先介绍一下这次的测试平台,CPU 当然是这次的主角 i9-12900K,为 Intel Core i 系列最强,也是目前消费级市场最强大的处理器。
搭配的是华硕 ProArt Z690 Creator WiFi 主机板。这款主机板没有 RGB 灯覆盖,I/O 遮罩与晶片组都用了一些半透明与透明的造型,有种简洁的美,不愧称作 ProArt。
而这次选择这款主机板除了颜质与豪华的供电,其 I/O 的两个 Thunderbolt 与 4 条 M.2 更是重要的原因之一,对于之后外接设备的扩充与硬碟的加装都比较有弹性。
记忆体有两个,第一款为来自威刚的普条 DDR5-4800,主要测试在一般环境下 DDR5 的性能表现,毕竟多数人还是选择这种常见且较为便宜的普条。
另一条超频条为 XPG LANCER DDR5-5200 32GB,黑色精緻低调的外表正好搭配 ProArt 主机板。
而为了压制这高性能处理器,散热器为 darkFlash 全新推出的 DX360 v2 水冷散热器,全白设计与划算的价格,为他的优势。
SSD 选用的是 Teamgroup 的 T-Force CARDEA A440 1TB,为 PCI-E Gen4 7000MB/s 高速 SSD,最近价格低的有点夸张,可以参考。
而显示卡,则是我们熟悉的 ZOTAC GAMING GeForce RTX 3070 AMP Holo,侧面的渐层很漂亮。在众多的显示卡之中,我觉得 ZOTAC GAMING 的卡一向都是最有特色的那张。
而为了应付之后可能的吃电大户,Power Supply 选用的是全汉 Hydro PTM PRO 850W,一线厂商白金牌电供就属他最便宜,最近火红的 10 年保它也有。
最后机壳为方便拆装,选用的是颜值 NO.1 的 InWin 303C。
跑分 - i9-12900K 性能表现如何?
照往例还是先看一下跑分,首先测个 Cinebench R23,这款软体主要用来测试处理器的理论性能,多核 27576 分,单核 1983 分,击溃了竞品同价位的 Ryzen 9 5900X。可见这次 Intel 一点也不想慢慢挤牙膏啦,相较于 5900X,预设多核分数即高了 33%。
不过跑分很有感,功耗也不落人后呀,FPU 烧机功耗达 220.7 W。
虽说单看功耗挺高的,不过如果将频率降下来,其实能够省电不少。我将 i9-12900K 全核心锁定 3GHz,R23 此时分数依旧有着 18336 分,但 FPU 功耗却仅剩下了 65.9W。
就此看来,Intel 7 製程,也就是对应台积电的 7nm 製程虽说延后了许多,但也是真的有料,能够兼顾高频性能与低频的省电。而既然提到了省电,就不得不提这次的 P-Core、E-Core。P-Core 大核心的性能你们刚刚已经见识过了,那么小核心 E-Core 呢?由于 BIOS 不能将所有 P-Core 关闭,故我们这里用了一些方式,使得 R23 能够只在 E-Core 上跑,看跑分。8 颗 E-Core 全开分数 7944,已经比 Core i5-10500 还要高了,单核心分数 1126 也能够与以往的 Skylake 微架构匹敌。
听起来 E-Core 其实也很强了吧?告诉你,精彩的还没说,在定频 3GHz 时,i9 的能耗比来到了惊人的 278.2,可是连 Zen3 都只能垂涎三尺。而且,看一下 E-Core 的能耗比,哇!339.3 是什么鬼?!远远超越其他竞争者。所以简单对比一下你就可以发现,Intel 说 P-Core 与 E-Core 的结合能够提升处理器性能不是开玩笑,4 颗 E-Core 占的面积与 1 颗 P-Core 雷同,R23 却提升了将近 2 倍,且能用更低的功耗运行。
架构面还有另一点是 Hyper Thread,这东西你可把它当作是一颗处理器核心,模拟成两颗,其目的是要提升执行的效率。为了知道 HT 的性能提升数据,我将 i9 的所有 E-Core 关闭。此时 R23 得分 19795。顺带一提,就算少了 8 颗小核心助阵,且核心数目比 R9 5900X 少,这个分数仍就可以打平 AMD R9 5900X。而在将 Hyper Thread 关闭后,分数来到了 16228。也就是开启 Hyper Thread 技术,可以有着 21% 的性能提升。
由此可知,这次 Intel 第 12 代处理器能够有如此大的提升,来自于
1. Intel 7 製程的进步
2. P-Core、E-Core 的结合
3. 架构提升
其中就架构的能耗比而言,Alder Lake 确实优于其他架构许多,不管是高性能的 P-Core,又或是高能效的 E-Core。而两者的搭配又使的处理器在应付不同类型的运算时更有弹性。
实际情形 - P-Core、E-Core 真有那么厉害?
不过这都是理论上,对于 R23 这种跑分软体来说,当然能够活用每个处理器的核心。然而面对真实场景,如游戏,处理器的每个核心未必都能够实时被运用。那么 P-Core、E-Core 还有优势吗?这就得用到了 Intel 强调的 Thread Director 技术,Thread Director 透过提供作业系统 Scheduler 每个核心的状态与性能,让 OS Schedular 能够运算出此时哪个核心最适合哪个运算,理论上比较複杂的运算会分给 P-Core,较为简单的运算会扔给 E-Core。像是游戏时的运算就可能会交由 P-Core 处理,而同时如果有在录影,这录影的运算就可能交由 E-Core 处理。由于主要的 Scheduling 还是得靠 OS 处理,因此在新的作业系统 Windows 11 下,才能够完整应用 Thread Director 的资源,达到最佳效率。
那可能会有人好奇,P-Core E-Core 的分配机制究竟是如何?在用了多种测试以及观察后,我发现分配机制先以 P-Core 为第一优先,当 P-Core 有空位时,优先分配给 P-Core;而第二顺位则是 E-Core,最后才是 P-Core 的 Hyper Thread。
所以问题来了,既然 1 颗 P-Core 核心面积与 4 颗 E-Core 大致相同,那么全 P-Core vs P-Core + E-Core 真的会有比较好的效果吗?
为了验证这件事,也避免 i9 核心太多效益不明显的问题,我们对比两种情况
1. 6 颗 P-Core
2. 4 颗 P-Core + 7 颗 E-Core
首先理论性能 R23,6 颗 P-Core 得分 14977,E-Core 组别 17987 分。可见理论上确实是大小核心的搭配较为强势。
再来跑渲染,Blender bmw 渲染,P-Core 组别耗时 162 秒,E-Core 组却仅有 137 秒。可见对于动画创作等实际应用,大小核心仍有实际的优势在。
最后游戏情境,跑的游戏是微软的 Forza Horizon 4。由于显卡瓶颈,两者的游戏帧数皆为 168 FPS,但是 P-Core 组别在 Forza Horizon 4 的 CPU 模拟与 CPU 绘图的 FPS,相较于 E-Core 组别却反而提升了 15% 的 FPS。
这情况还蛮有趣的,由此可观察到,对于游戏而言,因为跑游戏时并不会运用到所有的核心,因此大核心为主还是比较吃香的;而对于渲染、跑运算来说,多核心效能才是最重要的,因此多核心 E-Core 的加入使的效率能够更加提升。
当然作业系统对于 P-Core E-Core 的分配可不只前面提到的优先权而已,包含程式在前台、后台,或是运算跑的指令集等都会有影响。Thread Director 的存在意义是给予 OS Scheduler 足够的资讯,那毕竟这东西是第一次出现在 x86 处理器上,所以我觉得可以预期,未来 Scheduling 的效率应该可以更加的提升,就希望 Wintel 联盟还能带给我们什么好料啰。
oneAPI - Intel 想打造出他们自己的 CUDA?
oneAPI 这东西说来有点複杂,简单来说就是让软体开发者可以透过一个统一的方式去存取硬体做运算。oneAPI 整合了 CPU、GPU 与 FPGA,因此理论上这东西的覆盖範围广,能够更容易地被推广。这东西的实际应用之一就是深度学习。以往碰深度学习,基本上就是只能用 NVIDIA 的 CUDA+cudnn,而有了 oneAPI 与 oneDNN 后,或许之后会赶上 CUDA 那倒也不是不可能。
总之以往常常遇到专业软体或是某些特定领域,如:Tensorflow、Solidworks 都只能选用 NVIDIA 的显示卡,但随着 oneAPI 的被各大框架支援,或许以后这情况能够改善也说不定?
况且 oneAPI 的开源也是喊真的,我在查 AMD 的类似技术时,发现他们有针对 EPYC 处理器推出了 ZenDNN,但你仔细看,里面的描述就有这么一条
ZenDNN is based on OneDNN/DNNL v1.3 and leverages its basic infrastructure and APIs.
基本上就是说 ZenDNN 的技术也是继承自 oneDNN,如果连竞争对手也都同意这东西的话,那我觉得这是真的有发展潜力的。
那当然,API 有支持,但硬体性能有跟上才有用,这边测试了下 i9-12900K 与 R9 5900X 跑 Tensorflow 框架的深度学习运算性能,i9-12900K 以 1 倍的优势辗压 R9 5900X,可见 Intel 说 Alder Lake 有针对深度学习优化所言不假。
结论 - Intel 第 12 代处理器值得购买?
Intel 第 12 代 Alder Lake 处理器,老实说表现出奇的好。可能是因为第 11 代真的有点悽惨,也可能是因为 Intel 难得一次端出这么多惊喜。P-Core / E-Core、Intel 7 製程,以及性能大提升的 Golden Cove 微架构。对于玩家来说,我觉得第 12 代还是很划算的,特别是 i5 处理器,凭藉着大核心优势与较为亲民的价格,可以预期之后这颗处理器与 B 系列主机板的大受欢迎。那对于创作者来说,单核性能大提升且搭配 P-Core、E-Core 异质架构,性能的提升是无庸置疑的;而除了架构上的提升,Intel 这次的 Z690 也是卯足功夫,一次给了 20 条 PCI-E Gen4 以及 Thunderbolt 的支持。CPU 更是提供了 16 条 PCI-E Gen5,对应在主机板上也可以看到夸张的 4 条 Gen4 M.2。
总而言之言而总之,如果你正好想换电脑,Alder Lake 绝对会是个好选择,至于要上 DDR4 或是 DDR5,我觉得这就看你之后会不会想去升级记忆体了,像我这种有严重换换病的用户,DDR4 当然不能满足我。选择 DDR5 更多的是尝鲜,那要选帅气的超频条,还是一般较为便宜的 DDR5-4800,我觉得就看你想投多少预算到这上面吧。
而在见识了 P-Core E-Core 这组合的优异表现后,我不禁开始期待第 12 代架构应用上笔电的情境,这 E-Core 的高能效表现估计能让笔电的性能提升上不少。