写点什么

对话英特尔院士 Tom Petersen:持续优化锐炫驱动,游戏性能强劲提升

作者:E科讯
  • 2023-08-23
    湖北
  • 本文字数:2966 字

    阅读完需:约 10 分钟

自去年英特尔发布锐炫显卡以来,尤其是在进入到今年之后,英特尔加快了锐炫显卡驱动的更新频次,进而使得锐炫显卡在 DX9、DX11游戏方面取得了显著进步。同时在 DX12 游戏方面,得益于架构优势,锐炫显卡本身就有着良好的性能支持。

·DX11、DX9 游戏体验大幅提升

根据英特尔最新披露的数据来看,锐炫 A750 8GB 限量版显卡在最新驱动加持,以及搭配英特尔 13 代酷睿 i5-13400F 处理器的情况下,相对于首发时的驱动版本,1080P 分辨率下 DX11 游戏性能已经足足提升了 19%,99%低帧流畅度提升了 20%。了解硬件的朋友都知道,仅凭驱动优化就取得如此大幅度的提升并不容易,但是英特尔锐炫做到了。






截至目前为止,英特尔在今年已经推出了多达十数个个大大小小的锐炫显卡驱动,总计已经推出了近 30 个驱动版本的更新。

今年一季度,英特尔发布的针对 DX9 游戏大幅提升的驱动,促使平均性能提升约为 43%,与此同时,锐炫 A750 显卡降价至 249 美元,整体性价比大幅提升。



以《CS:GO》、《英雄联盟》等游戏为例,在首版驱动 3490 和一季度发布的 4086 驱动之间,DX9 游戏体验的提升是极大的,最高达到了 77%,最低也有 10%的平均帧率提升,这使得英特尔锐炫显卡在 DX9 游戏上的不足得到弥补。



今年二季度,英特尔进一步深入研究了 CPU 与 GPU 的平衡问题,通过大量数据统计,表明锐炫 A750 合适搭配的选择是酷睿 i5,随后提供了大量优惠,加速了锐炫的推广进程。



在新发售游戏优化方面,目前英特尔为 57 款新游戏提供了 Day 0 Gameon 的首日优化支持,这意味着当一款新的大型游戏发布时,英特尔需要完成所有的优化工作,并准备好所有的驱动,进而为玩家带来更好体验。



此外,Intel XeSS 技术也在加快拓展游戏支持,目前原生支持 XeSS 技术的游戏已经超过 70 款。可能也只有英特尔这样拥有强大生态能力的公司,才能在短短一年不到的时间里达成如此多里程碑的吧。

·CPU 与 GPU 的平衡关系

在一系列优化验证过程中可以看到,英特尔提供的数据都是在锐炫 A750 与英特尔酷睿 i5 处理器基础上进行的测试,因为数据显示酷睿 i5 处理器是锐炫 A750 的最佳平衡选择,那么此时就会有一个问题产生:如果使用酷睿 i9 处理器去做相同测试会发生什么呢?

从下图可以看到,对于酷睿 i9 处理器,最新驱动与初版驱动之间的性能提升在 9%到 30%之间,虽然也是相当大的提升,但比起酷睿 i5 最高 77%的提升显然是要稍微逊色一些。



总体来说,酷睿 i5 平均性能提升在 19%~20%,而酷睿 i9 约为 12%,当看到这组数据时,是不是有悖于我们惯有的认知呢?性能越强的处理器不是应该提升更明显吗?



其实并非如此。当你使用集成显卡的时候,CPU 因为负载更大,所以 CPU 性能提升往往有着更高的收益比;而当 GPU 性能足够强时,很多时候性能受限就转移到了 CPU 上,因此驱动程序需要重新架构,以减少每帧所需的 CPU 工作量,此时 CPU 的提升收益就完全不如 GPU 提升收益来的大了。

我们都知道,游戏每一个画面帧都需要一定的渲染时间,也就是 Frametime,帧生成时间。下图是英特尔官方给出的渲染流程示意图,简单来说就是游戏每一帧开始时会执行一系列逻辑,随后进行物理计算,进行命中检测,将目标移动到新的位置,可能会绘制新的几何图形等,之后会进入渲染过程。



在计算完游戏状态之后,它会将所有的游戏状态传递给一个渲染器,然后渲染器将从游戏状态转换为DirectX调用并进行传递,之后会执行名为 Present”的操作,它是一个DX命令,当被调用时,就意味着已经将所有图形信息都发送给了 DirectX,它现在可以渲染一帧,CPU 随之进入等待状态,等待“Present”返回之后,进入下一个循环,也就是开始等待渲染新的一帧。

·什么是 GPU Busy?

为了搞清楚从一帧的“Present”到下一个帧的“Present”之间的时间间隔,也为了搞清楚 CPU 与 GPU 之间在这些阶段的平衡关系,英特尔引入了一个新的衡量指标:GPU Busy。通过 GPU Busy 指标,用户可以了解到 GPU 使用多少时间进行实际渲染,多少时间是空闲等待状态。同时可以了解游戏运行时,CPU 与 GPU 工作是否处于平衡状态,是彼此之间高效协同工作,还是互相闲置互扯后腿。



因此,GPU Busy 可以帮助玩家更加清晰直观地了解到自己的 CPU 与 GPU 是否匹配,二者时间是否存在一些瓶颈,同时还能够分析出游戏分辨率、画质设定是否合适,以便做出更有对策性地调整。

英特尔院士 Tom Petersen 表示,“GPUBusy 会因游戏而异。在设置中,一般来说,在运行更多的 GPU 密集型活动时,GPU Busy 的程度会更高,当较少时,它会更低,并且大多数情况下可以很容易通过更改分辨率体现出来。”

比如以 1080P 分辨率、Ultra 画质下的《守望先锋 2》测试为例,锐炫 A750 显卡在搭配酷睿 i5 处理器时,在首发 3490 驱动版本下以及在后续 4571 版本下,GPU Busy(黄色)与帧生成时间(蓝色)之间的状态有着非常显著的差异。




在使用 4571 驱动时,GPU Busy 与帧生成时间几乎处于完全同步的状态,这意味着 CPU 与 GPU 在绝大部分时间都能够高效协同工作,不会出现明显的空闲等待期,因此在效率上获得显著提升。

GPU Busy 这项指标也能够衡量出游戏在不同画质时的 GPU Busy 与帧生成时间之间的状态。如下面两张图所示,在《反恐精英2》这款游戏中,同样配置、同为 4571 驱动的情况下,1080P 分辨率低画质和 Ultra 画质时的曲线状态差异非常明显。如果作为玩家看到这样的 GPU Busy 指标状态,那么就会明白,这款游戏在当前配置下最合适的画质设定就是“Ultra”,而非“Low”。




可见,在引入 GPU Busy 指标之后,如果玩家特别在于 CPU 与 GPU 的工作效率,亦或者说想要获得最佳游戏体验,就能够更加针对性地去选择硬件搭配和游戏设定了。

·通过 PresentMon Beta 更好地了解 GPU Busy

那么我们如何才能够测量出自己电脑的 GPU Busy 指标呢?为此,英特尔推出了 PresentMon Beta 测试工具。它是为终端用户和媒体提供的工具,可以使 GPU Busy 与帧生成时间之间的平衡关系变得可视化。它同时兼容 N 卡和 A 卡,支持 DirectX11、12、OpenGL、Vulkan 等 API。



如下图所示,PresentMon 提供了全新的叠加视图功能,在游戏时可以实时监测各项性能数据,如 GPU Busy 指标、游戏实时帧率、GPU 占用率、温度等信息,还能够监测 99%低帧状态等。



PresentMon 可由用户进行界面显示参数的自定义,调整显示效果等等,它包含了大约 30 种不同的参数可以监控,用户可以将其设置为数字文本或图形图表模式,同时它也支持直方图,通过不同的 UI 形式让用户更加了解自己电脑游戏时的状态。





其实在笔者看来,如果英特尔能够把 PresentMon 集成到 Arc Control 控制面板里会更加方便。但根据 Tom Petersen 的介绍来看,PresentMon 其实本身也是一个软件的集合,因此它涵盖了一些底层 SDK,以便为高级别的软件提供服务。随着后续版本更新,Arc Control 可能会逐步开始利用 PresentMon 服务,但目前还无法实现。因此现阶段英特尔首先是将可 PresentMon 的各项功能加以完善,让它能更加独立地运行。此外考虑到 PresentMon 可以兼容 N 卡、A 卡,因此现阶段作为独立软件去使用会更符合自身定位。

·结语

自去年 10 月发布锐炫 GPU 以来,英特尔在短时间内大幅优化了 DX9 游戏体验,并且重新设计了 DX11 驱动,带来了高达 19%左右的游戏性能提升以及大约 20%的 99 百分位提升。

此外,英特尔全新引入 GPU Busy 指标去衡量游戏过程中 CPU 与 GPU 之间的平衡关系,并且可以帮助用户通过更改游戏画质设定、分辨率设定等来提升硬件效率。同时,英特尔推出全新的 Intel PresentMon Beta 测试工具,终端用户可以自由下载,并通过它来监测电脑状态,了解自己电脑的 GPU Busy 指标。

文章来源:中关村在线

用户头像

E科讯

关注

专注intel动态 2020-08-19 加入

搜罗各种Intel新闻

评论

发布
暂无评论
对话英特尔院士Tom Petersen:持续优化锐炫驱动,游戏性能强劲提升_E科讯_InfoQ写作社区