Tensor 和 RT 核心在 NVIDIA Turing GPU 上佔用的空間較少

即使在首款 GeForce RTX 20 系列顯示卡發布期間,許多人也認為 Turing GPU 的尺寸並不小,這要歸功於附加單元的存在:RT 核心和張量核心。 現在,一位 Reddit 用戶分析了 Turing TU106 和 TU116 GPU 的紅外線影像,得出的結論是,新的運算單元佔用的空間並不像最初想像的那麼多。

Tensor 和 RT 核心在 NVIDIA Turing GPU 上佔用的空間較少

首先,讓我們回想一下,Turing TU106 GPU 是最年輕、最緊湊的 NVIDIA 晶片,具有用於光線追蹤的特殊 RT 核心和用於加速人工智慧功能的張量核心。 反過來,與其相關的圖靈TU116圖形處理器被剝奪了這些特殊的計算單元,這就是決定對它們進行比較的原因。

Tensor 和 RT 核心在 NVIDIA Turing GPU 上佔用的空間較少
Tensor 和 RT 核心在 NVIDIA Turing GPU 上佔用的空間較少

NVIDIA Turing GPU分為TPC單元,其中包括一對串流多處理器(Streaming Multiprocessors),其中已經包含了所有運算核心。 事實證明,Turing TU106 GPU 的 TPC 面積僅比 Turing TU1,95 多 116 mm²,即 22%。 其中,1,25 mm² 用於張量核心,只有 0,7 mm² 用於 RT 核心。

Tensor 和 RT 核心在 NVIDIA Turing GPU 上佔用的空間較少
Tensor 和 RT 核心在 NVIDIA Turing GPU 上佔用的空間較少

事實證明,如果沒有新的張量和 RT 核心,作為 GeForce RTX 102 Ti 基礎的旗艦圖靈 TU2080 圖形處理器將佔用 754 平方毫米,而是 684 平方毫米(36 TPC)。 反過來,作為 GeForce RTX 104 基礎的 Turing TU2080 可以佔用 498 mm²,而不是 545 mm² (24 TPC)。 正如您所看到的,即使沒有張量和 RT 核心,較舊的圖靈 GPU 也將是非常大的晶片。 明顯更多的 Pascal GPU。


Tensor 和 RT 核心在 NVIDIA Turing GPU 上佔用的空間較少

那麼如此大的規模的原因是什麼呢? 首先,Turing GPU 具有更大的快取大小。 著色器的尺寸也有所增加,圖靈晶片具有更大的指令集和更大的寄存器。 所有這些使得圖靈 GPU 不僅面積顯著增加,而且效能也顯著增加。 例如,同樣基於 TU2060 的 GeForce RTX 106 提供與基於 GP1080 的 GeForce GTX 104 幾乎相同等級的效能。 順便說一下,後者的 CUDA 核心數量增加了 25%,儘管它佔用的面積為 314 mm2,而新 TU410 的面積為 2 mm106。 




來源: 3dnews.ru

添加評論