自古以来,计算机和各个系统组件的游戏能力都是以每秒帧数来衡量的,测试的黄金标准是长期基准,可让您在可持续性能方面比较不同的设备。 然而,近年来,人们开始从不同的角度看待GPU性能。 在显卡评测中,出现了各个帧的渲染持续时间的图表,FPS稳定性问题受到充分关注,平均帧速率现在通常伴随着最小值,并通过帧时间的第99个百分位进行过滤。 测试方法的改进旨在发现平均帧速率中溶解的延迟,但有时用户的肉眼相当明显。
然而,测试系统内运行的任何软件测量工具只能提供对隐藏变量的间接估计,而隐藏变量对于舒适的游戏至关重要,即按下键盘或鼠标按钮与更改显示器上的图像之间的延迟时间。 你必须遵循一个简单的规则,即游戏的 FPS 越高、越稳定,输入的响应时间就越短。 而且,刷新率为 120、144 或 240 Hz 的快速显示器已经解决了部分问题,更不用说未来的 360 Hz 屏幕了。
然而,游戏玩家,尤其是竞技性多人游戏玩家,他们希望在硬件上比对手有丝毫优势,并愿意为了 CS:GO 中数十个额外的 FPS 而构建定制超频计算机。直接评估输入滞后。 毕竟,像用高速摄像机拍摄屏幕这样精确且劳动密集型的方法只有在实验室条件下才能实现。
但现在一切都会改变 - LDAT(延迟显示分析工具)是一种用于测量游戏延迟的通用硬件工具。 熟悉 FCAT 等缩写词的读者可能会猜测这是 NVIDIA 产品。 没错,该公司向选定的 IT 出版物提供了该设备,其中包括 3DNews 的编辑。 让我们看看一种新的测量技术是否可以揭示输入延迟的神秘现象,并帮助游戏玩家选择电子竞技比赛的组件。
⇡ # LDAT--它是如何工作的
LDAT的工作原理非常简单。 该系统的核心是带有微控制器的高速光传感器,安装在屏幕上的所需位置。 将改装的鼠标连接到它,控制软件通过USB接口检测按下按键和图像亮度局部跳跃之间的时间。 因此,如果我们将传感器放在射击游戏的枪管顶部,我们将获得显示器、计算机和整个软件堆栈(包括设备驱动程序、游戏、和操作系统)来响应用户输入。
这种方法的优点在于 LDAT 的操作完全独立于计算机上安装的硬件和程序。 事实上,NVIDIA 还致力于生产另一种测量工具,而且该工具仅向有限的 IT 记者开放,这表明该公司正在寻求突出自己产品与竞争对手相比的优势(这几年前 FCAT 就已经发生过)。 事实上,支持 G-SYNC 的 360 Hz 显示器即将出现在市场上,游戏开发人员将开始使用 NVIDIA Reflex 库,旨在减少运行 Direct3D 12 的游戏的延迟。但是,我们相信 LDAT 本身并不提供任何让步“绿色”显卡,不会扭曲“红色”显卡的结果,因为当该设备通过 USB 电缆连接到另一台运行控制软件的机器时,无法访问实验硬件的配置。
不用说,LDAT在其应用领域开辟了巨大的前景。 将游戏显示器(甚至电视)与一种或另一种刷新率和不同类型的矩阵进行比较,检查自适应同步技术 G-SYNC 和 FreeSync 如何影响延迟,使用显卡或显示器进行帧缩放 - 所有这一切都已成为可能。 但首先,我们决定专注于更具体的任务,并测试几款专为高 FPS 和低反应时间设计的竞技游戏在不同价格类别的显卡上的运行情况。 为了更准确地表述这个问题,我们对两个主要问题感兴趣:过高的帧速率是否可以保证低延迟,以及在什么条件下增加帧速率有意义(从而购买更强大的显卡)。 特别是,如果您自豪地拥有高速 240 Hz 显示器,那么超过与屏幕刷新率相对应的帧速率是否有用?
为了进行测试,我们选择了四个流行的多人游戏项目 - CS:GO、DOTA 2、Overwatch 和 Valorant,这些项目对现代 GPU(包括预算模型)的要求不高,足以实现数百 FPS 的性能。 同时,当恒定条件最重要时,所列出的游戏可以轻松组织一个可靠测量反应时间的环境:角色的位置相同,每次测试中使用一把武器等。因此,我们不得不暂时推迟《绝地求生》和《堡垒之夜》等游戏的基准测试。 PUBG 根本不具备与其他玩家隔离的能力,即使在测试范围内也是如此,而 Fortnite 的单人战斗实验室模式仍然无法避免战利品事故,因此无法在同一武器中测试多个 GPU合理的时间。
此外,特色游戏还具有运行 Direct3D 11 API 的优势,与 Direct3D 12 不同,它允许显卡驱动程序对帧的渲染队列设置限制,CPU 可以准备在软件图形管道中渲染到 GPU 。
在标准情况下,特别是当系统的瓶颈是显卡的计算资源时,帧队列默认增加到三个,或者如果应用程序需要,甚至更多。 因此,Direct3D 可确保连续的 GPU 负载和恒定的渲染速率。 但这会产生延迟输入响应的副作用,因为 API 不允许将预先计划的帧从队列中抛出。 显卡驱动程序中的相应设置正是为了对抗延迟,AMD以Radeon Anti-Lag品牌推广了这种设置,随后NVIDIA推出了类似的低延迟模式选项。
然而,这些措施并不是解决延迟问题的万能药:例如,如果游戏的性能受到中央处理器而不是图形处理器的能力的限制,那么较短的帧队列(或完全不存在)只会使 CPU 瓶颈变得更窄。 除了测试计划的其余部分之外,我们还打算了解 Radeon 抗延迟和低延迟模式“技术”是否在哪些游戏中以及在哪些硬件上具有切实的好处。
⇡ # 测试台、测试方法
测试台 | |
---|---|
中央处理器 | 英特尔酷睿 i9-9900K(4,9 GHz、4,8 GHz AVX、固定频率) |
Материнскаяплата | 华硕 MAXIMUS XI APEX |
手术记忆 | 奇技 Trident Z RGB F4-3200C14D-16GTZR,2 × 8 GB(3200 MHz,CL14) |
只读存储器 | 英特尔固态盘 760p,1024 GB |
电源装置 | 海盗船 AX1200i,1200 瓦 |
CPU冷却系统 | 海盗船 Hydro 系列 H115i |
Корпус | 酷冷至尊测试台V1.0 |
监控 | NEC EA244UHD |
操作系统 | Windows 10 Pro x64 |
适用于 AMD GPU 的软件 | |
所有视频卡 | AMD Radeon Software Adrenalin 2020 版 20.8.3 |
NVIDIA GPU 软件 | |
所有视频卡 | NVIDIA GeForce Game Ready 驱动程序 452.06 |
所有游戏中的帧速率和反应时间的测量都是在最大或接近最大图形质量设置下进行的,以便 a) 突出比较设备之间的差异,b) 在超过屏幕刷新率的高帧速率下获得结果,以及反之亦然。 特别是在本文中,我们借用了一款快速的三星 Odyssey 9 显示器 (C32G75TQSI),具有 WQHD 分辨率和 240 Hz 刷新率——这是现代消费类显示器的最高刷新率,直到 360 Hz 标准屏幕上市。 自适应刷新率技术(G-SYNC 和 FreeSync)已被禁用。
每个单独测试的结果(特定游戏中的特定显卡,有或没有抗滞后驱动程序设置)是根据 50 次测量的样本获得的。
游戏 | API | 设置 | 全屏抗锯齿 |
---|---|---|---|
反恐精英:全球攻势 | DirectX 11的 | 最大限度。 图形质量(运动模糊关闭) | 8x MSAA |
DOTA 2 | 最佳外观品质 | 外汇牌号 | |
监工 | 史诗品质,100% 渲染比例 | SMAA 介质 | |
勇敢 | 最大限度。 图形质量(晕影关闭) | 多级抗锯齿x4 |
⇡ # 测试参与者
AMD Radeon RX 5700 XT(1605/1905 MHz,14000 Mbps,8 GB) ;AMD Radeon RX 5500 XT(1607/1845 MHz,14000 Mbps,8 GB) ;AMD Radeon RX 590(1469/1545 MHz,8000 Mbps,8 GB) ;NVIDIA GeForce RTX 2080 Ti 创始人版(1350/1635 MHz、14000 Mbps、11 GB) ;NVIDIA GeForce RTX 2070 SUPER(1605/1770 MHz,14000 Mbps,8 GB) ;NVIDIA GeForce RTX 2060 SUPER(1470/1650 MHz,14000 Mbps,8 GB) ;NVIDIA GeForce GTX 1650 SUPER(1530/1770 MHz,8000 Mbps,4 GB) ;NVIDIA GeForce GTX 1650(1485/1725 MHz,8000 Mbps,4 GB) .
约。 在视频卡名称后面的括号中,根据每个设备的规格指示了基本频率和升压频率。 非参考设计视频卡符合参考参数(或接近参考参数),前提是无需手动编辑时钟频率曲线即可完成此操作。 否则(GeForce 16 系列加速器以及 GeForce RTX Founders Edition),将使用制造商的设置。
⇡ # 反恐精英:全球攻势
第一款游戏《CS:GO》的测试结果引人深思。 这是整个测试计划中最轻的项目,其中 GeForce RTX 2080 Ti 等显卡的帧速率超过 600 FPS,甚至八个测试参与者中最弱的(GeForce GTX 1650 SUPER 和 Radeon RX 590)也保持远高于刷新率监视器频率为 240 Hz。 尽管如此,CS:GO 完美地说明了这样一个论点:将 FPS 提高到显示器频率以上对于减少延迟来说完全没有用处。 如果我们将顶级组的显卡(GeForce RTX 2070 SUPER 及更高版本,以及 Radeon RX 5700 XT)与较低型号(GeForce GTX 1650 SUPER、GeForce GTX 1060、Radeon RX 5500 XT 和 Radeon RX 590)进行比较,我们谈论的是从按下鼠标按钮到屏幕上出现闪光所用的时间,一般来说有一倍半的差异。 从绝对值来看,增益达到 9,2 毫秒 - 乍一看并不算多,但是,例如,通过将屏幕刷新率从 60 赫兹更改为 144 赫兹(9,7 毫秒),可以获得几乎相同的量!
至于属于同一大价格类别,但基于不同制造商的芯片进行比较的显卡的延迟如何,我们没有发现各组之间存在显着差异。 这同样适用于旨在通过减少 Direct3D 11 中的帧队列来减少延迟的加速器驱动程序中的选项。在 CS:GO 上(至少在这些测试条件下),它们通常不会产生有用的效果。 在较弱的显卡组中,响应时间略有变化,但只有 GeForce GTX 1650 SUPER 在结果中达到了统计显着性。
约。 饱和颜色图标表示标准驱动程序设置的结果。 褪色的图标表示低延迟模式 (Ultra) 或 Radeon Anti-Lag 已启用。 注意垂直刻度 - 它从零以上开始。
反恐精英:全球攻势 | ||||||
---|---|---|---|---|---|---|
默认情况下, | 低延迟模式(超)/Radeon 抗延迟 | |||||
平均帧率、FPS | 平均反应时间,毫秒 | 艺术。 反应时间偏差,ms | 平均帧率、FPS | 平均反应时间,毫秒 | 艺术。 反应时间偏差,ms | |
GeForce RTX 2080 Ti | 642 | 20,7 | 6,5 | 630 | 21 | 4,6 |
GeForce RTX 2070 SUPER | 581 | 20,8 | 5 | 585 | 21,7 | 5,6 |
GeForce RTX 2060 SUPER | 466 | 23,9 | 4,6 | 478 | 22,4 | 5,8 |
GeForce GTX 1650超级 | 300 | 27,6 | 4,3 | 275 | 23,2 | 5,4 |
Radeon RX 5700 XT | 545 | 20,4 | 5,8 | 554 | 21,5 | 4,4 |
Radeon RX 5500 XT | 323 | 29,3 | 14 | 316 | 26,5 | 14,5 |
RX的Radeon 590 | 293 | 29,3 | 5,8 | 294 | 27,5 | 4,9 |
GeForce GTX 1060 (6 GB) | 333 | 29,6 | 7,9 | 325 | 28,2 | 12,9 |
约。 平均反应时间(根据学生 t 检验)的统计显着差异以红色突出显示。
⇡ # DOTA 2
尽管按照当前标准,DOTA 2 也被认为是一款要求不高的游戏,但它使现代显卡更难达到数百 FPS。 因此,参与比较的所有预算解决方案的帧速率均降至每秒 240 帧(与屏幕刷新率相对应)以下。 从 Radeon RX 5700 XT 和 GeForce RTX 2060 SUPER 开始,强大的加速器可产生超过 360 FPS 的速度,但与 CS:GO 不同的是,DOTA 2 更有效地引导 GPU 的过剩性能来应对延迟。 在上一款游戏中,Radeon RX 5700 XT级别的显卡就足够了,没有必要为了反应时间而进一步提高性能。 在这里,在更强大的显卡(直至 GeForce RTX 2080 Ti)上,延迟持续减少。
需要注意的是,引起质疑的是Radeon RX 5700 XT在这场比赛中的成绩。 AMD 当前的旗舰产品在延迟时间方面甚至远远超过了 GeForce RTX 2060,尽管帧速率更高,但性能并不比较新的型号好。 但减少DOTA 2中的帧渲染队列确实很有用。 这种影响并没有那么大,即使是经验丰富的网络运动员也会注意到它,但对于八分之四的显卡来说,它具有统计显着性
约。 饱和颜色图标表示标准驱动程序设置的结果。 褪色的图标表示低延迟模式 (Ultra) 或 Radeon Anti-Lag 已启用。 注意垂直刻度 - 它从零以上开始。
DOTA 2 | ||||||
---|---|---|---|---|---|---|
默认情况下, | 低延迟模式(超)/Radeon 抗延迟 | |||||
平均帧率、FPS | 平均反应时间,毫秒 | 艺术。 反应时间偏差,ms | 平均帧率、FPS | 平均反应时间,毫秒 | 艺术。 反应时间偏差,ms | |
GeForce RTX 2080 Ti | 418 | 17,7 | 2 | 416 | 17,4 | 1,4 |
GeForce RTX 2070 SUPER | 410 | 18,2 | 1,6 | 409 | 17,6 | 1,6 |
GeForce RTX 2060 SUPER | 387 | 20,8 | 1,5 | 385 | 19,8 | 1,6 |
GeForce GTX 1650超级 | 230 | 27,9 | 2,5 | 228 | 27,9 | 2,3 |
Radeon RX 5700 XT | 360 | 26,3 | 1,5 | 363 | 25,2 | 1,3 |
Radeon RX 5500 XT | 216 | 25,4 | 1,2 | 215 | 21,7 | 1,4 |
RX的Radeon 590 | 224 | 25 | 1,4 | 228 | 21,8 | 1,3 |
GeForce GTX 1060 (6 GB) | 255 | 25,8 | 1,9 | 254 | 25,8 | 1,7 |
约。 平均反应时间(根据学生 t 检验)的统计显着差异以红色突出显示。
⇡ # 监工
《守望先锋》是四款测试游戏中最重的一款,具有最高的图形质量,并且启用了全屏抗锯齿功能。 毫不奇怪,GPU 性能的每千兆次浮点运算都有利于响应时间。 《守望先锋》中 GeForce RTX 2080 Ti 和 Radeon RX 5500 XT 等显卡之间的延迟值范围是两倍。 数据还显示,比 GeForce RTX 2070 SUPER 更强大的显卡只能提高 FPS,但即使名义上也无法加快反应速度。 但从理论上讲,用臭名昭著的 RTX 5700 SUPER 取代 Radeon RX 2060 XT 或 GeForce RTX 2070 SUPER 是有意义的,以便将延迟降至最低,同时保持较高的图形质量。 此外,在《守望先锋》中,“红”芯片上的一款加速器再次表现不佳。 这次是 Radeon RX 5500 XT,它在平均响应延迟方面显着超越了所有其他预算解决方案。
《守望先锋》再次证明了:a) 显卡的速度,即使在高帧速率下,仍然会影响延迟量,b) 形式上更强大的 GPU 并不能保证更低的输入响应延迟。 除此之外,游戏还演示了图形驱动程序的抗延迟设置的标准操作。 如果您使用相对较弱的显卡(GeForce GTX 1650 SUPER、GeForce GTX 1060、Radeon RX 5500 XT 和 Radeon 590)进行游戏,减少帧队列可以将延迟减少 9% 到 17%。 好吧,对于强大的硬件来说它仍然完全没有用。
约。 饱和颜色图标表示标准驱动程序设置的结果。 褪色的图标表示低延迟模式 (Ultra) 或 Radeon Anti-Lag 已启用。 注意垂直刻度 - 它从零以上开始。
监工 | ||||||
---|---|---|---|---|---|---|
默认情况下, | 低延迟模式(超)/Radeon 抗延迟 | |||||
平均帧率、FPS | 平均反应时间,毫秒 | 艺术。 反应时间偏差,ms | 平均帧率、FPS | 平均反应时间,毫秒 | 艺术。 反应时间偏差,ms | |
GeForce RTX 2080 Ti | 282 | 35,6 | 10,4 | 300 | 34,2 | 9,6 |
GeForce RTX 2070 SUPER | 225 | 35,8 | 5,1 | 228 | 36,7 | 8,6 |
GeForce RTX 2060 SUPER | 198 | 41,2 | 6,4 | 195 | 38,8 | 9 |
GeForce GTX 1650超级 | 116 | 58,2 | 8 | 115 | 51 | 8,7 |
Radeon RX 5700 XT | 210 | 39,6 | 7,2 | 208 | 41,4 | 7,2 |
Radeon RX 5500 XT | 120 | 69,7 | 13,2 | 120 | 63,5 | 15,1 |
RX的Radeon 590 | 111 | 61,2 | 8,6 | 111 | 51,7 | 7,7 |
GeForce GTX 1060 (6 GB) | 121 | 60,7 | 8,7 | 118 | 50,7 | 6,5 |
约。 平均反应时间(根据学生 t 检验)的统计显着差异以红色突出显示。
⇡ # 勇敢
《Valorant》凭借出色(或者相反,平庸)的图形优化在测试游戏中脱颖而出。 事实是,尽管测试 GPU 的潜在性能存在巨大差异,但根据帧率估算,它们都集中在 231 至 309 FPS 的范围内。 尽管我们特意选择了资源最密集的场景来进行延迟测量,以增强预期的差异。 然而,就延迟值的分布而言,《Valorant》与《CS:GO》有些相似。 在这场游戏中,GeForce RTX 2060 SUPER 或 Radeon RX 5700 XT 的拥有者与更昂贵、更强大的加速器的用户处于平等的地位。 即使是较新的 GeForce GTX 1650 SUPER 和 Radeon RX 5500 XT 级别的显卡也没有落后于较旧的显卡太多。 考虑到这些输入,限制《Valorant》中的 Direct3D 帧队列毫无用处也就不足为奇了:相应的设置对于选定的显卡具有统计上显着的影响,但其幅度绝对可以忽略不计。
约。 饱和颜色图标表示标准驱动程序设置的结果。 褪色的图标表示低延迟模式 (Ultra) 或 Radeon Anti-Lag 已启用。 注意垂直刻度 - 它从零以上开始。
勇敢 | ||||||
---|---|---|---|---|---|---|
默认情况下, | 低延迟模式(超)/Radeon 抗延迟 | |||||
平均帧率、FPS | 平均反应时间,毫秒 | 艺术。 反应时间偏差,ms | 平均帧率、FPS | 平均反应时间,毫秒 | 艺术。 反应时间偏差,ms | |
GeForce RTX 2080 Ti | 309 | 19,3 | 2,6 | 306 | 20,2 | 3 |
GeForce RTX 2070 SUPER | 293 | 19,2 | 3,1 | 289 | 19,5 | 2,9 |
GeForce RTX 2060 SUPER | 308 | 20,7 | 2,7 | 310 | 19,6 | 2,9 |
GeForce GTX 1650超级 | 251 | 24,5 | 2,9 | 243 | 23,6 | 2,5 |
Radeon RX 5700 XT | 256 | 21,9 | 3,3 | 257 | 21,9 | 2,7 |
Radeon RX 5500 XT | 258 | 23,5 | 2,8 | 262 | 22,8 | 2,6 |
RX的Radeon 590 | 237 | 25,8 | 2,7 | 234 | 24,3 | 2,5 |
GeForce GTX 1060 (6 GB) | 269 | 23,5 | 2,8 | 268 | 23,4 | 4,4 |
约。 平均反应时间(根据学生 t 检验)的统计显着差异以红色突出显示。
⇡ # 发现
用硬件测量游戏中的响应滞后已经产生了丰富的结果,坦率地说,这对业界公认的评估显卡性能的方法提出了质疑,因为几十年来唯一的测量参数一直是帧速率。 当然,FPS和延迟密切相关,但是,至少在电子竞技游戏中,当每一毫秒的延迟都在争夺时,帧率不再能够全面描述性能。
在对流行的多人游戏项目的简要研究中,我们发现了一些有趣的现象。 首先,我们的数据反驳了流行的观点,即将 FPS 提高到超出与屏幕刷新率对应的值是没有意义的。 即使在非常快的 240Hz 显示器上,像《反恐精英:全球攻势》这样的游戏也可以通过从廉价显卡升级到高端型号来将延迟减少一倍半。 我们讨论的是与例如从 60 Hz 屏幕移动到 144 Hz 时相同的反应时间增益。
另一方面,当更强大的显卡只会徒劳地加热空气并且不再有助于对抗已经极低的延迟时,帧速率仍然可能过高。 在我们以 1080p 测试的所有游戏中,我们没有发现 GeForce RTX 2070 SUPER 和 GeForce RTX 2080 Ti 之间存在任何有意义的差异。 我们记录的绝对最小响应时间是 17,7 毫秒,是在 DOTA 2 中获得的。顺便说一句,这并不是一个适中的值,如果转换成刷新率,则相当于 57 赫兹。 因此,以下结论不言自明:即将推出的 360 Hz 显示器肯定会在竞技游戏中得到应用 - 当计算机硬件已经耗尽其功能并受到操作系统、图形等厚软件堆栈的限制时,这是减少延迟的直接方法API、驱动程序和游戏本身。
然后我们检查了抗延迟软件是否有任何好处,到目前为止,抗延迟软件可以归结为限制依赖 Direct3D 9 和 11 图形 API 的应用程序中的帧渲染队列 - AMD 驱动程序中臭名昭著的 Radeon Anti-Lag 和 Low NVIDIA 中的延迟模式。 事实证明,这两种“技术”确实有效,但只有在系统瓶颈是 GPU 而不是中央处理器的情况下才能带来切实的好处。 在我们使用超频 Intel Core i7-9900K 处理器的测试系统中,此类工具有助于廉价的中性能显卡(Radeon RX 5500 XT、GeForce GTX 1650 SUPER 和上一代的类似快速加速器),但当您使用这些工具时,这些工具就完全没有意义了。拥有强大的GPU。 然而,当抗延迟设置发挥作用时,它们可能非常有效,可以将某些《守望先锋》的延迟减少多达 10 毫秒,即原始延迟的 17%。
最后,我们发现不同制造商的显卡之间存在某些差异,这些差异无法仅从帧速率来预测。 因此,AMD 显卡有时会提供与正式更高效的“绿色”设备相同的短延迟(例如:CS:GO 中的 Radeon RX 5700 XT),而在其他情况下,它们的工作速度会慢得令人怀疑(DOTA 2 中的相同模型)。 如果像 LDAT 这样的硬件延迟测量技术得到普及,我们不会感到惊讶,那些为比对手争取哪怕一丁点优势的狂热网络运动员将开始为特定游戏选择显卡——具体取决于哪种型号提供最短的反应时间。
但最重要的是,得益于 LDAT,我们有能力进行更深入的延迟研究。 我们在此预览中所做的只是冰山一角。 诸如自适应同步技术(G-SYNC 和 FreeSync)对延迟的影响、限制游戏中的 FPS、对 CPU 性能的依赖等主题仍然不在讨论范围之内。 此外,我们还将找出数百 FPS 的高帧率以及相应的快速输入响应是否不仅可以在针对这些标准专门优化的竞技游戏中实现,而且可以在系统负载过高的 AAA 项目中实现。更多的。 因此,普通玩家(而不是冠军)是否需要一台刷新率为 240 甚至 360 Hz 的尖端显示器? 我们将在未来的工作中使用 LDAT 来回答这些问题。
来源: 3dnews.ru