Tensor- og RT-kjerner tar ikke så mye plass på NVIDIA Turing GPUer

Selv under kunngjøringen av de første skjermkortene i GeForce RTX 20-serien, mente mange at Turing GPU-er skylder sine overhodet ikke små dimensjoner til tilstedeværelsen av tilleggsenheter: RT-kjerner og tensorkjerner. Nå har en Reddit-bruker analysert infrarøde bilder av Turing TU106 og TU116 GPUene og konkludert med at de nye dataenhetene ikke tar så mye plass som opprinnelig antatt.

Tensor- og RT-kjerner tar ikke så mye plass på NVIDIA Turing GPUer

Til å begynne med, la oss huske at Turing TU106 GPU er den yngste og mest kompakte NVIDIA-brikken med spesielle RT-kjerner for ray tracing og tensor-kjerner for å akselerere kunstig intelligens-funksjoner. På sin side er Turing TU116-grafikkprosessoren, som er relatert til den, fratatt disse spesielle dataenhetene, og det er derfor det ble besluttet å sammenligne dem.

Tensor- og RT-kjerner tar ikke så mye plass på NVIDIA Turing GPUer
Tensor- og RT-kjerner tar ikke så mye plass på NVIDIA Turing GPUer

NVIDIA Turing GPUer er delt inn i TPC-enheter, som inkluderer et par streaming multiprosessorer (Streaming Multiprocessors), som allerede inkluderer alle datakjernene. Og som det viser seg, har Turing TU106 GPU bare 1,95 mm² mer TPC-areal enn Turing TU116, eller 22 %. Av dette arealet er 1,25 mm² for tensorkjerner, og bare 0,7 mm² er for RT-kjerner.

Tensor- og RT-kjerner tar ikke så mye plass på NVIDIA Turing GPUer
Tensor- og RT-kjerner tar ikke så mye plass på NVIDIA Turing GPUer

Det viser seg at uten den nye tensoren og RT-kjernene, ville flaggskipet Turing TU102-grafikkprosessoren, som ligger til grunn for GeForce RTX 2080 Ti, ikke okkupere 754 mm², men 684 mm² (36 TPC). På sin side kunne Turing TU104, som er grunnlaget for GeForce RTX 2080, okkupere 498 mm² i stedet for 545 mm² (24 TPC). Som du kan se, selv uten tensor- og RT-kjerner, ville eldre Turing GPU-er være veldig store brikker. Betydelig flere Pascal GPUer.


Tensor- og RT-kjerner tar ikke så mye plass på NVIDIA Turing GPUer

Så hva er grunnen til så store størrelser? For det første har Turing GPUer hatt større cache-størrelser. Størrelsen på shaderne er også økt, og Turing-brikker har større instruksjonssett og større registre. Alt dette gjorde det mulig å øke ikke bare området, men også ytelsen til Turing GPUer betydelig. For eksempel gir den samme GeForce RTX 2060 basert på TU106 nesten samme ytelsesnivå som GeForce GTX 1080 basert på GP104. Sistnevnte har forresten et 25% større antall CUDA-kjerner, selv om den har et areal på 314 mm2 mot 410 mm2 for den nye TU106. 




Kilde: 3dnews.ru

Legg til en kommentar