在NVIDIA在GeForce RTX系列显卡上演示了实时光线追踪之后,很难怀疑这项技术(与光栅化算法的合理结合)是电脑游戏的未来。 然而,直到最近,基于图灵架构且具有专用 RT 核心的 GPU 还被认为是唯一具有适合于此的计算能力的离散 GPU。
对首批掌握光线追踪技术的游戏(《战地 2060》、《地铁:离去》和《古墓丽影:暗影》)的测试表明,即使是 GeForce RTX 加速器(尤其是其中最年轻的 RTX XNUMX),在混合渲染任务。 尽管早期取得了成功,实时光线追踪还不是一项成熟的技术。 只有当不仅最先进、最昂贵的设备,而且中端显卡在新一波游戏中达到相同的性能标准时,才能宣告黄仁勋公司发起的范式转变终于发生。
帕斯卡中的光线追踪 - 优点和缺点
但现在,虽然没有提及图灵架构的未来后继者,但 NVIDIA 已决定推动进步。 在上个月的 GPU 技术大会活动上,绿色团队宣布 Pascal 芯片上的加速器以及图灵家族的低端成员(GeForce GTX 16 系列)将获得与 RTX 同等的实时光线追踪功能- 品牌产品。 如今,所承诺的驱动程序已经可以在 NVIDIA 官方网站上下载,设备列表包括 GeForce 10 系列的型号,从 GeForce GTX 1060(6 GB 版本)、Volta 芯片上的专业 TITAN V 加速器开始,当然,还有采用 TU116 芯片的中等价位新型号 - GeForce GTX 1660 和 GTX 1660 Ti。 该更新还影响了具有相应 GPU 的笔记本电脑。
从技术角度来看,这里没有什么超自然的。 早在图灵架构出现之前,具有统一着色器单元的 GPU 就能够执行光线追踪,尽管当时它们的速度还不够快,无法满足游戏中对这种功能的需求。 此外,除了专有的 NVIDIA OptiX 等封闭 API 之外,软件方法没有统一的标准。 现在,Vulkan 编程接口中已经有了针对 Direct3D 12 的 DXR 扩展以及类似的库,无论 GPU 是否配备了专门的逻辑,游戏引擎都可以访问它们,只要驱动程序提供了这种能力。 为此,Turing 芯片具有独立的 RT 核心,在 Pascal 架构 GPU 和 TU116 处理器中,光线追踪以通用计算格式在着色器 ALU 阵列上实现。
然而,我们从 NVIDIA 本身了解到的有关图灵架构的一切都表明 Pascal 不适合支持 DXR 的应用程序。 在去年专门针对 Turing 系列旗舰型号(GeForce RTX 2080 和 RTX 2080 Ti)的演示中,工程师提出了以下计算结果。 如果将上一代最好的消费级显卡(GeForce GTX 1080 Ti)的所有资源投入光线追踪计算,所得性能不会超过 RTX 11 Ti 理论性能的 2080%。 同样重要的是,Turing 芯片的免费 CUDA 核心可以同时用于其他图像组件的并行处理 - 着色器程序的执行、异步执行期间的非图形 Direct3D 计算队列等。
在实际游戏中,情况更为复杂,因为在现有的硬件上开发人员大量使用DXR功能,而大部分计算负载仍然被光栅化和着色器指令占据。 此外,使用光线追踪创建的一些各种效果也可以在 Pascal 芯片的 CUDA 核心上很好地执行。 例如,《战地 V》中的镜面并不意味着光线的二次反射,因此对于上一代强大的显卡来说是一个可行的负载。 这同样适用于《古墓丽影:暗影》中的阴影,尽管渲染由多个光源形成的复杂阴影已经是一项更加困难的任务。 但即使对于图灵来说,《地铁:离去》的全球覆盖也很困难,并且不能指望帕斯卡在任何程度上产生类似的结果。
无论人们怎么说,我们谈论的是图灵架构的代表与 Pascal 芯片上最接近的类似物之间理论性能的多重差异。 此外,不仅 RT 核心的存在,而且新一代加速器的众多总体改进特征也对图灵有利。 因此,Turing 芯片可以对实数 (FP32) 和整数 (INT) 数据执行并行运算,携带大量本地缓存内存和单独的 CUDA 核心以进行降低精度计算 (FP16)。 所有这些意味着图灵不仅可以更好地处理着色器程序,而且还可以相对有效地计算光线追踪,而无需专门的块。 毕竟,使用光线追踪进行渲染如此耗费资源的原因不仅在于搜索光线和几何元素之间的交点(RT 核心所做的),还在于计算交点处的颜色(着色)。 顺便说一句,所列出的图灵架构的优势完全适用于 GeForce GTX 1660 和 GTX 1660 Ti,尽管 TU116 芯片没有 RT 核心,因此使用软件光线追踪对这些显卡进行测试特别令人感兴趣。
但理论已经足够了,因为我们已经根据我们自己的测量收集了“Pascals”(以及年轻的“Turings”)在《战地 XNUMX》、《地铁:离去》和《古墓丽影:暗影》中的表现数据。 请注意,驱动程序和游戏本身都不会调整光线数量,以减少没有 RT 核心的 GPU 的负载,这意味着 GeForce GTX 和 GeForce RTX 上的效果质量应该是相同的。
测试台、测试方法
测试台 | |
---|---|
中央处理器 | 英特尔酷睿 i9-9900K(4,9 GHz、4,8 GHz AVX、固定频率) |
Материнскаяплата | 华硕 MAXIMUS XI APEX |
手术记忆 | 奇技 Trident Z RGB F4-3200C14D-16GTZR,2 x 8 GB(3200 MHz,CL14) |
只读存储器 | 英特尔固态盘 760p,1024 GB |
电源装置 | 海盗船 AX1200i,1200 瓦 |
CPU冷却系统 | 海盗船 Hydro 系列 H115i |
Корпус | 酷冷至尊测试台V1.0 |
监控 | NEC EA244UHD |
操作系统 | Windows 10 Pro x64 |
NVIDIA GPU 软件 | |
NVIDIA GeForce RTX 20 | NVIDIA GeForce Game Ready 驱动程序 419.67 |
NVIDIA GeForce GTX 10/16 | NVIDIA GeForce Game Ready 驱动程序 425.31 |
游戏测试 | ||||
---|---|---|---|---|
游戏 | API | 设置、测试方法 | 全屏抗锯齿 | |
1920×1080 / 2560×1440 | 3840×2160 | |||
战场V | DirectX 12的 | OCAT,自由使命。 最大限度。 图形质量 | TAA高 | TAA高 |
地铁出运 | DirectX 12的 | 内置基准。 超图形质量配置文件 | TAA | TAA |
古墓丽影之影 | DirectX 12的 | 内置基准。 最大限度。 图形质量 | SMAA 4x | 离开 |
平均和最低帧速率指标源自各个帧的渲染时间数组,该数组由内置基准测试(《地铁:离去》、《古墓丽影:暗影》)或 OCAT 实用程序(如果游戏没有)记录(战地 V)。
图表中的平均帧速率是平均帧时间的倒数。 为了估计最小帧速率,需要计算测试中每秒形成的帧数。 从该数字数组中,选择与分布的第一个百分位数相对应的值。
测试参与者
以下显卡参与了性能测试:
- NVIDIA GeForce RTX 2080 Ti 创始人版(1350/14000 MHz,11 GB);
- NVIDIA GeForce GTX 2080 创始人版(1515/14000 MHz,8 GB);
- NVIDIA GeForce RTX 2070 创始人版(1410/14000 MHz,8 GB);
- NVIDIA GeForce RTX 2060 创始人版(1365/14000 MHz,6 GB);
- NVIDIA GeForce GTX 1660 Ti (6 GB);
- NVIDIA GeForce GTX 1660 (6 GB);
- NVIDIA GeForce GTX 1080 Ti(1480/11000 MHz,11 GB);
- NVIDIA GeForce GTX 1080(1607/10000 MHz,8 GB);
- NVIDIA GeForce GTX 1070 Ti(1608/8008 MHz,8 GB);
- NVIDIA GeForce GTX 1070(1506/8008 MHz,8 GB);
- NVIDIA GeForce GTX 1060(1506/9000 MHz,6 GB)。
战场V
由于《战地 V》本身是一款相当轻量的游戏(尤其是在 1080p 和 1440p 模式下),并且它在补丁中使用光线追踪,因此使用 DXR 选项测试 GeForce 10 系列取得了令人鼓舞的结果。 然而,在芯片级不支持光线追踪的所有型号中,我们不得不将自己限制在 GTX 1070/1070 Ti 和 GTX 1080/1080 Ti 型号上。 Electronic Arts 游戏会对硬件配置的频繁更改产生怀疑,并会阻止用户一段或几天的时间。 因此,一旦《战地 V》从我们的测试机中取消限制,GeForce GTX 1060 和两款 GeForce GTX 16 系列设备的性能测量结果就会出现在本文中。
从百分比来看,无论屏幕分辨率如何,任何测试参与者在各种光线追踪质量设置下都经历了大致相同的性能下降。 因此,GeForce RTX 20 品牌的显卡在低质量和中等质量 DXR 效果下性能下降 28-43%,在高质量和最高质量下性能下降 37-53%。
如果我们谈论的是 GeForce 10 系列的旧型号,那么在低和中光线追踪级别下,游戏的 FPS 会下降 36% 到 42%,而在高质量(高和超高设置)下,DXR 已经消耗了 54-67%帧速率的%。 请注意,在许多(如果不是大多数)战地 V 游戏场景中,低设置和中设置之间、高设置和超高设置之间在图像清晰度或性能方面没有明显差异。 为了希望 Pascal GPU 对此设置更加敏感,我们在所有四种设置下进行了测试。 事实上,确实出现了某些差异,但仅限于 2160p 分辨率和 6% FPS 以内。
从绝对意义上讲,Pascal 芯片上的任何较旧加速器都可以在 60p 模式下将帧速率维持在 1080 FPS 以上,但反射质量会降低,而 GeForce GTX 1080 Ti 声称即使在高级别跟踪时也能得到类似的结果。 但一旦转向 1440p 分辨率,只有 GeForce GTX 1080 和 GTX 1080 Ti 能够提供 60 FPS 或更高的舒适帧率以及低或中光线追踪质量,并且在 4K 模式下,上一代显卡都没有合适的计算能力(事实上,除了旗舰版 GeForce RTX 2080 Ti 之外,任何 Turing 都一样。
如果我们寻找 GeForce GTX 10 和 GeForce RTX 20 品牌下的特定加速器之间的相似之处,那么上一代的最佳型号 (GeForce GTX 1080 Ti) 相当于在没有 DXR 的标准渲染任务中的 GeForce RTX 2080,由于光线追踪质量下降,下降到了 GeForce RTX 2070 的水平,而在高水平上它只能与 GeForce RTX 2060 对抗。
战地 V,最大质量 | |||||
---|---|---|---|---|---|
1920×1080 高清 | |||||
实时关闭 | 保留时间低 | RT培养基 | 室温高 | RT超 | |
NVIDIA GeForce RTX 2080 Ti FE (11 GB) | 100% | -28% | -28% | -37% | -39% |
NVIDIA GeForce RTX 2080 FE (8 GB) | 100% | -34% | -35% | -43% | -44% |
NVIDIA GeForce RTX 2070 FE (8 GB) | 100% | -35% | -36% | -46% | -45% |
NVIDIA GeForce RTX 2060 FE (6 GB) | 100% | -42% | -43% | -50% | -51% |
NVIDIA GeForce GTX 1660 Ti (6 GB) | 100% | ND | ND | ND | ND |
NVIDIA GeForce GTX 1660 (6 GB) | 100% | ND | ND | ND | ND |
NVIDIA GeForce GTX 1080 Ti (11 GB) | 100% | -40% | -39% | -54% | -58% |
NVIDIA GeForce GTX 1080 (8 GB) | 100% | -41% | -41% | -57% | -61% |
NVIDIA GeForce GTX 1070 Ti (8 GB) | 100% | -40% | -41% | -57% | -59% |
NVIDIA GeForce GTX 1070 (8 GB) | 100% | -38% | -39% | -57% | -61% |
NVIDIA GeForce GTX 1060 (6 GB) | 100% | ND | ND | ND | ND |
战地 V,最大质量 | |||||
---|---|---|---|---|---|
2560×1440 高清 | |||||
实时关闭 | 保留时间低 | RT培养基 | 室温高 | RT超 | |
NVIDIA GeForce RTX 2080 Ti FE (11 GB) | 100% | -33% | -34% | -44% | -45% |
NVIDIA GeForce RTX 2080 FE (8 GB) | 100% | -37% | -38% | -47% | -49% |
NVIDIA GeForce RTX 2070 FE (8 GB) | 100% | -36% | -36% | -48% | -48% |
NVIDIA GeForce RTX 2060 FE (6 GB) | 100% | -41% | -42% | -51% | -52% |
NVIDIA GeForce GTX 1660 Ti (6 GB) | 100% | ND | ND | ND | ND |
NVIDIA GeForce GTX 1660 (6 GB) | 100% | ND | ND | ND | ND |
NVIDIA GeForce GTX 1080 Ti (11 GB) | 100% | -40% | -40% | -59% | -62% |
NVIDIA GeForce GTX 1080 (8 GB) | 100% | -36% | -39% | -59% | -63% |
NVIDIA GeForce GTX 1070 Ti (8 GB) | 100% | -39% | -39% | -58% | -62% |
NVIDIA GeForce GTX 1070 (8 GB) | 100% | -38% | -38% | -59% | -63% |
NVIDIA GeForce GTX 1060 (6 GB) | 100% | ND | ND | ND | ND |
战地 V,最大质量 | |||||
---|---|---|---|---|---|
3840×2160 高清 | |||||
实时关闭 | 保留时间低 | RT培养基 | 室温高 | RT超 | |
NVIDIA GeForce RTX 2080 Ti FE (11 GB) | 100% | -30% | -30% | -44% | -47% |
NVIDIA GeForce RTX 2080 FE (8 GB) | 100% | -31% | -32% | -46% | -49% |
NVIDIA GeForce RTX 2070 FE (8 GB) | 100% | -40% | -38% | -53% | -52% |
NVIDIA GeForce RTX 2060 FE (6 GB) | 100% | -28% | -30% | -44% | -53% |
NVIDIA GeForce GTX 1660 Ti (6 GB) | 100% | ND | ND | ND | ND |
NVIDIA GeForce GTX 1660 (6 GB) | 100% | ND | ND | ND | ND |
NVIDIA GeForce GTX 1080 Ti (11 GB) | 100% | -36% | -37% | -60% | -63% |
NVIDIA GeForce GTX 1080 (8 GB) | 100% | -40% | -43% | -64% | -67% |
NVIDIA GeForce GTX 1070 Ti (8 GB) | 100% | -38% | -42% | -62% | -65% |
NVIDIA GeForce GTX 1070 (8 GB) | 100% | -36% | -42% | -63% | -66% |
NVIDIA GeForce GTX 1060 (6 GB) | 100% | ND | ND | ND | ND |
来源: 3dnews.ru