Tensor 和 RT 核心在 NVIDIA Turing GPU 上占用的空间较少

即使在首款 GeForce RTX 20 系列显卡发布期间,许多人也认为 Turing GPU 的尺寸并不小,这要归功于附加单元的存在:RT 核心和张量核心。 现在,一位 Reddit 用户分析了 Turing TU106 和 TU116 GPU 的红外图像,得出的结论是,新的计算单元占用的空间并不像最初想象的那么多。

Tensor 和 RT 核心在 NVIDIA Turing GPU 上占用的空间较少

首先,让我们回想一下,Turing TU106 GPU 是最年轻、最紧凑的 NVIDIA 芯片,具有用于光线追踪的特殊 RT 核心和用于加速人工智能功能的张量核心。 反过来,与其相关的图灵TU116图形处理器被剥夺了这些特殊的计算单元,这就是决定对它们进行比较的原因。

Tensor 和 RT 核心在 NVIDIA Turing GPU 上占用的空间较少
Tensor 和 RT 核心在 NVIDIA Turing GPU 上占用的空间较少

NVIDIA Turing GPU分为TPC单元,其中包括一对流式多处理器(Streaming Multiprocessors),其中已经包含了所有计算核心。 事实证明,Turing TU106 GPU 的 TPC 面积仅比 Turing TU1,95 多 116 mm²,即 22%。 其中,1,25 mm² 用于张量核心,只有 0,7 mm² 用于 RT 核心。

Tensor 和 RT 核心在 NVIDIA Turing GPU 上占用的空间较少
Tensor 和 RT 核心在 NVIDIA Turing GPU 上占用的空间较少

事实证明,如果没有新的张量和 RT 核心,作为 GeForce RTX 102 Ti 基础的旗舰图灵 TU2080 图形处理器将占用 754 平方毫米,而是 684 平方毫米(36 TPC)。 反过来,作为 GeForce RTX 104 基础的 Turing TU2080 可以占用 498 mm²,而不是 545 mm² (24 TPC)。 正如您所看到的,即使没有张量和 RT 核心,较旧的图灵 GPU 也将是非常大的芯片。 明显更多的 Pascal GPU。


Tensor 和 RT 核心在 NVIDIA Turing GPU 上占用的空间较少

那么如此大的规模的原因是什么? 首先,Turing GPU 具有更大的缓存大小。 着色器的尺寸也有所增加,图灵芯片具有更大的指令集和更大的寄存器。 所有这些使得图灵 GPU 不仅面积显着增加,而且性能也显着增加。 例如,同样基于 TU2060 的 GeForce RTX 106 提供与基于 GP1080 的 GeForce GTX 104 几乎相同水平的性能。 顺便说一下,后者的 CUDA 核心数量增加了 25%,尽管它占用的面积为 314 mm2,而新 TU410 的面积为 2 mm106。 




来源: 3dnews.ru

添加评论