近几年的DIY市场,受虚拟货币、芯片产能不足等原因,玩家们深受显卡溢价之苦,普通用户想要以厂商建议零售价买到一块显卡成为奢望,AMD和NVIDIA加在一起几乎垄断了全球消费级独立GPU市场,用户没得选,要么出高价买,要么不用,实属糟糕。
现在,这种情况或许会很快就能有所改观,因为新的玩家入场了!它就是英特尔。
去年,英特尔表示将推出独立显卡,承诺为全球游戏玩家和内容创作者提供高性能的图形硬件、软件和服务。北京时间2022年3月30日,代号为Alchemist的英特尔锐炫独立显卡终于正式公布,首批产品为A系列移动端产品。首款搭载英特尔锐炫3系列独显的笔记本电脑——三星Galaxy Book2 Pro已于海外市场上市,搭载锐炫5和锐炫7系列显卡的笔记本包括游戏本产品,预计在今年夏天上市。
我们首先来看一看英特尔锐炫独立显卡的架构设计。
锐炫显卡基于Xe HPG微架构构建,每4个Xe内核组成了一个渲染切片(Rendering Slice)。每一个Xe内核中都配备了数量可观的运算单元,比如矢量引擎 XVE,矩阵引擎XMX。此外Xe HPG也集成了其他主流的图形技术,比如网格着色、采样器反馈等。与Xe核芯显卡中的EU单元不同,Xe-Core取代了EU的概念,成为Xe HPG架构中最基础的执行单元。它包括16个256位宽的SIMD矢量引擎,为传统图形着色器执行大部分的运算;还包含16个1024位宽的矩阵引擎,专为加速AI运算设计。为了满足矩阵、矢量和光线追踪单元的高带宽需求,英特尔在每个Xe内核中构建了一个192KB 的大型本地内存,它可以根据每个工作负载的需要在L1缓存和共享本地内存(SLM) 之间动态分配。
渲染切片(Rendering Slice)是可重用IP的基本构建块,渲染切片支持DX12 Ultimate,其中包括对所有图形固定功能块的改进,当然还支持微软DXR和Vulkan RT的专用硬件光追单元。这样的设计扩展性也很强,“胶水大法”同样适用——通过叠加两个渲染切片就可以构建更强的的SoC,目前最多支持8个。
Xe HPG微架构提供两种核心选择,代号分别为ACM-G10和ACM-G11,前者包含多达32个Xe内核和光追单元,16MB的L2缓存,256位GDDR6显存,16路PCIE 4接口,后者包含8个Xe内核和光追单元,4MB的L2缓存,96位GDDR6显存接口,8路PCIE 4。两种核心都包含两个Xe多功能编解码引擎和4个显示引擎。
类似于酷睿处理器的定位划分,锐炫A系列移动版显卡分为3、5、7系列,其中3系面向主流游戏,5系列面向性能级游戏,7系定位最高,面向硬核性能游戏。A系列移动端独立显卡现在提供5款型号,包括2款ARC 3系列、1款ARC 5系列和2款ARC 7系列。
5款型号覆盖了十分宽泛的功耗水平,从25W到150瓦,其中A370M的最高功耗可以达到50W,而150W是定位最高的A770M,其它详细规格见上图。
所有的英特尔锐炫独立显卡都将包含通用架构和高级功能集,包括XMX矩阵引擎、Xe媒体引擎、Xe显示引擎和Xe图形管线。
其中XMX矩阵引擎可以针对INT8推理提供高达16X的算力,专门用来处理AI加速相关的工作负载。
Xe媒体引擎内置了业内使用广泛的编/解码器,包括H.265 / HEVC、H.264 / MPEG-4 / AVC、VP9以及AV1编码和解码的硬件加速支持。所有这些专用IP和固定功能逻辑使锐炫能够以非常低的CPU利用率来完成编解码器集合。Xe媒体引擎也是首次支持AV1格式的编解码,最高支持8K 10-bit HDR的工作流。
因此锐炫也是英特尔首个完整支持AV1硬件加速的显卡产品,比软件编码快50倍。AV1的效率比最常见的H.264编解码器高了50%,比HEVC高了20%,因此能够以更低的带宽和更小的文件大小提供更高的画面质量。FFMPEG、Handbrake、Adobe和XSplit都已经集成了对锐炫AV1的支持。
Xe显示引擎支持4个显示通道,支持HDMI 2.0b和DP 1.4a标准,最高支持4路4K@120Hz的输出,或者2路8K@60Hz视频信号,1080p和1440p分辨率下均可以支持360Hz的刷新率。
另外锐炫支持Adaptive Sync显示同步技术,提供无画面撕裂的流畅体验;Speed Sync可以为当前帧提供加速,降低延时、减少撕裂;Smooth Sync则可以通过抖动过滤功能对画面撕裂进行模糊化处理,提供更好的沉浸感。
至于大家最关心的性能方面,官方给出了几组对比数据:与锐矩Xe核芯显卡相比,英特尔锐炫A370M在1080p游戏中的性能有了大幅提升,在中高画质的设定下,全部可以跑到60帧以上的水平,在部分游戏中甚至达到了90帧以上的平均帧率,在高画质设定的《无畏契约》游戏中,平均帧率可达115帧。
在内容创作方面,锐炫A370M独立显卡相比锐矩Xe核芯显卡也获得了大幅性能提升,在Premiere的场景编码嗅探中,性能提升更是高达140%,提升了内容创作的效率。
接下来,还要说一说英特尔锐炫独立显卡所支持的两项技术——Deep Link和XeSS。
Deep Link是一个总称,涵盖了几种不同的技术。首先,基于机器学习服务引擎(MLS,是OpenVino中的一个框架,它能智能地把负载分配给不同的算力模块)可以实现动态功率共享,针对所有工作负载提供性能优化,智能地适应用户的性能需求,可以更智能地分配CPU和GPU的功率配比,在系统功耗的限制范围内,尽可能最大化释放CPU或GPU的性能。但是目前仅支持12代酷睿处理器。
超级编码则是媒体编码引擎的结合,通过使用oneVPL API接口,同时使用CPU和GPU上所有可用的媒体编码引擎进行编码,大大提升编解码效率。
超级算力则是使用多引擎内容创作,使用英特尔平台上所有可用的计算引擎或AI加速器来加速创作过程,同样基于机器学习服务MLS实现。
Deep Link的加入,让锐炫独立显卡为内容创作加速,在超级编码中最高可获得60%的性能提升。
XeSS则是由AI驱动的超级采样技术,与传统的高分辨率渲染相比,可在游戏中提供更高的性能。它使用神经网络辅助运动矢量,从低分辨率渲染中生成精美的高分辨率图像,类似于NVIDIA的DLSS技术。
英特尔表示利用AI和深度学习技术已经训练过各种不同类型的游戏,今天披露的14款游戏都将支持XeSS技术,预计未来几个月还会有更多的游戏加入,英特尔表示将继续深化与顶级游戏工作室的合作,以促进这种强大并开放的AI超分技术得到广泛的使用。
随着锐炫独立显卡的推出,英特尔也发布了新的显卡控制界面——ARC Control英特尔锐炫控制面板。ARC Control提供了一站式与锐炫显卡相关的设定或者信息接收,包括可以让用户快速升级驱动,及时看到显卡工作负载、虚拟摄像头设定、自动生成游戏高光时刻等功能。
以上就是英特尔锐炫独立显卡移动版的产品细节,大家觉得有哪些亮点?是否满足预期呢?欢迎在评论区给我们留言讨论。
对了,英特尔的EVO认证现在也已经扩展到了使用锐炫独立显卡的产品上,与之搭配的处理器可以是12代酷睿移动版H系列或P系列,而U系列由于没有太多的余量功耗空间,暂时不会搭配锐炫独立显卡。
多年来,英特尔交付了一代又一代的CPU,为全球数十亿人提供计算原力。从超极本到EVO,英特尔一直专注于平台级的创新。持续的创新惠及全球数十亿用户,显然,现在英特尔已经到达下一个重要的里程碑——用独立显卡来进一步完善英特尔计算平台。
对于广大普通消费者、游戏玩家们来说,英特尔加入独立显卡市场当然是好事儿。早前Intel GPU业务负责人Raja Koduri曾表示,“显卡的供货对PC玩家和整个行业来说都很重要,Intel显卡部门正在想方设法实现每年向游戏玩家交付数百万片ARC显卡的目标。”显卡价格是不是有希望打下来了?当然,这还得看将于今年下半年推出的英特尔桌面级独立显卡的表现。
(文中图片来自Intel)