桌面电脑> CPU主板显卡> 行业

​22年后英特尔放弃了超线程!Lunar Lake架构深度解析

PChome | 编辑:潘玮哲
原创
2024-06-05 18:02:21

【PChome概述】酷睿Ultra之后,英特尔还能带来怎么样的创新?最新公布Lunar Lake以全新设计的性能核心和能效核心、大幅降低的整体功耗、增强的核芯显卡性能以及史无前例的NPU性能提升与AI算力集成,将为AI PC带来澎湃的新动力。

全新性能核心砍掉超线程 E核当做P核用

Lunar Lake延续了Meteor Lake的分离式模块架构,采用3D Foveros 封装技术,但唯一的不同是:处处不同。Lunar Lake是一个全方位创新的新一代平台,无论是计算部分、还是控制部分、以及AI部分都发生了巨大的变化。简单来说:Lunar Lake的整体功耗相比上代下降了40%;核芯显卡的游戏和图形性能提高1.5倍;全新的NPU性能达前代4倍,平台AI算力高达120TOPS。 

先来看看整个芯片架构中的Compute Tile,也就是计算模块。首先,制造工艺升级为Intel 20A(台积电N3B制程),这也是英特尔“四年五制程节点”计划中的预定推进时间。

计算模块仍然采用混合架构设计,包含8个核心,4个性能核(P核)和4个能效核(E核),不再设有LP E,也就是低功耗能效核心,并且Lunar Lake只会提供这个规格的核心组合。

全新的性能核代号Lion Cove,首要的一个变化就是取消了超线程,也就是说英特尔自2002年发布超线程技术以来,首次在主流处理器平台上去掉了这个设置,原因也很简单,通过架构优化,在取消超线程的设置下,性能功耗比反而提升了,而且还提升了性能晶片尺寸比。当然,超线程就没有存在的必要了。

这也符合Lunar Lake的设计理念:去除任何对产品没有贡献的晶体管,以达到最高能效。Lion Cove着重优化了每瓦性能,这是衡量能效比的重要指标。它有2.5MB的L2缓存以及12MB的共享L3缓存,主要用来帮助实现出色的单线程性能。同时,这种微架构的突破为后续几代的P核设计奠定了新的基础。新的设计让性能核心实现了高达14%的代际性能提升,同时实现了更低的功耗。

全新的能效核心(Skymont)则是另外一种设计理念,Intel希望让E核能够涵盖更多的日常算力要求,日常应用、非极端重载的情况下,甚至不希望P核运行,从而降低能耗。所以Lunar Lake的E核是按照与Raptor Lake的P核性能相当的目标去设计的,同时还要保持E核级别的能效水平。

从12代酷睿之后的几代芯片中,E核已经被证明是比超线程更高效的一种多线程加速手段,也就是说如果要追求多线程性能,与其赋能超线程,不如去提高E核的能效。

在Lunar Lake上,这4个能效核有4MB的L2共享缓存,与Meteor Lake的LP E核心相比,能提供2倍的单线程性能和4倍的多线程性能,而且它增加了AI向量计算的吞吐量,使得其能够用于处理复杂的AI计算任务。

Skymont提高了核内并行处理能力,并在此基础上优化了能耗。和Raptor Lake的P核相比,IPC性能提高了2%,如果与Meteor Lake的LP E核相比,整数性能提升38%,浮点性能提升68%,非常可观。

功耗方面,和Meteor Lake的LP E核相比,Skymont仅用1/3的功耗就取得了一样的性能。因为Raptor Lake功耗涵盖的范围更广,可以跑在非常高的功耗区间,所以其绝对性能还是会超过Skymont,但Lunar Lake是面向移动端的产品,所以功耗范围是低于Raptor Lake的。因此在日常工作负载时,Skymont的性能表现相当领先,同样的性能下功耗只有Raptor Lake P核的60%,同功耗下,性能又比Raptor Lake的P核高出20%。

并且,Skymont核心的微架构是灵活的,Lunar Lake上只是4核心的配置,但在不久的将来,其它产品线,如桌面级处理器都会采用Skymont微架构。所以Skymont微架构的设计初衷不仅是低核心数,它也是非常适合于多核心的部署,这个架构是有延展性的。

通过以上的分析,我们不难发现Lunar Lake的性能核和能效核的设计形成了巧妙的互补,因为二者的完美协作,在广泛的任务当中能够既能体现它的性能优势,又能节省更多的功耗,帮助笔记本获得更长的续航时间。在较低功耗的区间,E核的性能实际上更强,但P核的功率上限更好,性能宽度拉得更极致。因此尽管P核取消了超线程,整个处理器的线程数量减少了,但Lunar Lake仍然能够取得多核性能的提升。

在性能核与能效核的调度方面,英特尔Lunar Lake中的硬件线程调度器(Intel Thread Director)也有改进与优化,带来了动态调度策略、增强算法、更精细的控制,EEM也有更大的定制范围。硬件线程调度器会充分考虑能效,如工作负载合适将优先分配给单能效核,多线程时进行能效核扩展,再根据需求引导至性能核。同时配合操作系统隔离区、加强电源管理等设计,也可以提高能效。

一键看全文
上一页

每日精选

荣耀Magic7创造AI新体验

2024-10-28

生成式AI驱动智能计算新时代

2024-10-28

雷军:小米15涨价依旧超值

2024-10-28

小米13只有残血版澎湃OS 2

2024-10-28