NVIDIA解释为何GeForce RTX 30系列加速器有如此飞跃的性能

NVIDIA于1月30日推出了新一代Ampere游戏显卡,但最初的演示几乎没有包含任何技术细节。 现在,几天后,该公司发布了文档,阐明了 GeForce RTX XNUMX 系列显卡与其前代产品的令人印象深刻的性能优势来自何处。

NVIDIA解释为何GeForce RTX 30系列加速器有如此飞跃的性能

许多人立即注意到,NVIDIA 网站上的 GeForce RTX 3090、GeForce RTX 3080 和 GeForce RTX 3070 的官方规格表明,其 CUDA 处理器的数量惊人。

NVIDIA解释为何GeForce RTX 30系列加速器有如此飞跃的性能

事实证明,与 Turing 相比,Ampere 游戏处理器的 FP32 性能确实提高了一倍,并且这与 GPU 基本构建模块——流处理器 (SM) 架构的变化有关。

NVIDIA解释为何GeForce RTX 30系列加速器有如此飞跃的性能

虽然图灵一代 GPU 中的 SM 有一条用于浮点运算的计算路径,但在安培中,每个流处理器都有两条路径,每个时钟周期总共可以执行多达 128 次 FMA 运算,而图灵则为 64 次。 同时,一半可用的 Ampere 执行单元能够执行整数 (INT) 运算和 32 位浮点 (FP32) 运算,而另一半器件专门用于 FP32 运算。 这种方法用于节省晶体管预算,因为游戏负载生成的 FP32 明显多于 INT 操作。 然而,图灵根本没有组合执行器。


NVIDIA解释为何GeForce RTX 30系列加速器有如此飞跃的性能

同时,为了向增强型流处理器提供必要的数据量,NVIDIA 将 SM 中的 L1 缓存大小增加了三分之一(从 96 KB 到 128 KB),吞吐量也增加了一倍。

Ampere 的另一个重要改进是 CUDA、RT 和 Tensor 核心现在可以完全并行运行。 例如,这使得图形引擎可以使用 DLSS 缩放一帧,同时在 CUDA 和 RT 核心上计算下一帧,从而减少功能节点的停机时间并提高整体性能。

为此,我们必须补充一点,在 Amrere 中实现的第二代 RT 核心可以计算三角形与射线的交集,速度是 Turing 中的两倍。 新的第三代张量核心在处理稀疏矩阵时的数学性能提高了一倍。

将 Ampere 计算三角形交点的速度提高一倍,应该会对支持光线追踪的游戏中 GeForce RTX 30 系列加速器的性能产生重大影响。 据 NVIDIA 称,正是这一特性成为了图灵架构的瓶颈,而边界平行六面体光线交点的计算速度并没有引起任何抱怨。 现在,追踪性能的平衡已经得到优化,而且,在 Ampere 中,两种类型的射线操作(三角形和平行六面体)都可以并行执行。

除此之外,Ampere 的 RT 内核还添加了新功能来插值三角形的位置。 当场景中并非所有三角形都处于恒定位置时,这可用于模糊运动中的对象。

为了说明这一切,NVIDIA 直接比较了 Turing 和 Ampere GPU 如何在 Wolfenstein Youngblood 中以 4K 分辨率处理光线追踪。 从图中可以看出,Ampere 在帧构建速度方面显着受益,这得益于第二代 RT 核心带来的更快的数学 FP32 计算,以及异构 GPU 资源的并行操作。

NVIDIA解释为何GeForce RTX 30系列加速器有如此飞跃的性能

此外,为了切实强化上述内容,NVIDIA 还提供了 GeForce RTX 3090、GeForce RTX 3080 和 GeForce RTX 3070 的额外测试结果。根据他们的说法,GeForce RTX 3070 在 60p 分辨率下比 GeForce RTX 2070 领先约 1440%,在支持 RTX 和传统光栅化的游戏中可以观察到这张图片,特别是在《无主之地 3》中。

NVIDIA解释为何GeForce RTX 30系列加速器有如此飞跃的性能

在 3080K 分辨率下,GeForce RTX 2080 的性能是 GeForce RTX 4 的两倍。 诚然,在这种情况下,在没有RTX支持的《无主之地3》中,新卡的优势不是翻倍,而是大约80%。

NVIDIA解释为何GeForce RTX 30系列加速器有如此飞跃的性能

而较旧的显卡 GeForce RTX 3090 在 NVIDIA 自己的测试中显示出比 Titan RTX 大约一倍半的优势。

NVIDIA解释为何GeForce RTX 30系列加速器有如此飞跃的性能

据科技记者报道,GeForce RTX 3080 参考设计的完整评论将于 14 月 17 日发布。 三天后,即 3080 月 30 日,它将被允许发布该公司合作伙伴生产的 GeForce RTX XNUMX 型号的测试数据。 因此,等待 GeForce RTX XNUMX 系列代表的独立测试结果出现在互联网上的时间已经所剩无几了。

来源:



来源: 3dnews.ru

添加评论