Tensor- og RT-kerner fylder ikke så meget på NVIDIA Turing GPU'er

Selv under annonceringen af ​​de første GeForce RTX 20-serie grafikkort, troede mange, at Turing GPU'er skylder deres slet ikke små dimensioner til tilstedeværelsen af ​​yderligere enheder: RT-kerner og tensorkerner. Nu har en Reddit-bruger analyseret infrarøde billeder af Turing TU106 og TU116 GPU'erne og konkluderet, at de nye computerenheder ikke fylder så meget som oprindeligt antaget.

Tensor- og RT-kerner fylder ikke så meget på NVIDIA Turing GPU'er

Til at begynde med, lad os huske på, at Turing TU106 GPU er den yngste og mest kompakte NVIDIA-chip med specielle RT-kerner til ray-tracing og tensorkerner til at accelerere kunstig intelligens-funktioner. Til gengæld er Turing TU116-grafikprocessoren, som er relateret til den, frataget disse specielle computerenheder, og det er derfor, det blev besluttet at sammenligne dem.

Tensor- og RT-kerner fylder ikke så meget på NVIDIA Turing GPU'er
Tensor- og RT-kerner fylder ikke så meget på NVIDIA Turing GPU'er

NVIDIA Turing GPU'er er opdelt i TPC-enheder, som inkluderer et par streaming multiprocessorer (Streaming Multiprocessors), som allerede inkluderer alle computerkernerne. Og som det viser sig, har Turing TU106 GPU kun 1,95 mm² mere TPC-areal end Turing TU116, eller 22%. Af dette areal er 1,25 mm² til tensorkerner, og kun 0,7 mm² er til RT-kerner.

Tensor- og RT-kerner fylder ikke så meget på NVIDIA Turing GPU'er
Tensor- og RT-kerner fylder ikke så meget på NVIDIA Turing GPU'er

Det viser sig, at uden den nye tensor og RT-kerner ville flagskibet Turing TU102-grafikprocessor, som ligger til grund for GeForce RTX 2080 Ti, ikke fylde 754 mm², men 684 mm² (36 TPC). Til gengæld kunne Turing TU104, som er grundlaget for GeForce RTX 2080, fylde 498 mm² i stedet for 545 mm² (24 TPC). Som du kan se, selv uden tensor- og RT-kerner, ville ældre Turing GPU'er være meget store chips. Betydeligt flere Pascal GPU'er.


Tensor- og RT-kerner fylder ikke så meget på NVIDIA Turing GPU'er

Så hvad er årsagen til så store størrelser? Til at begynde med har Turing GPU'er haft større cachestørrelser. Størrelsen på shaderne er også blevet øget, og Turing-chips har større instruktionssæt og større registre. Alt dette gjorde det muligt at øge ikke kun området markant, men også ydeevnen af ​​Turing GPU'er. For eksempel giver den samme GeForce RTX 2060 baseret på TU106 næsten det samme niveau af ydeevne som GeForce GTX 1080 baseret på GP104. Sidstnævnte har i øvrigt et 25% større antal CUDA-kerner, selvom det optager et areal på 314 mm2 mod 410 mm2 for den nye TU106. 




Kilde: 3dnews.ru

Tilføj en kommentar