Tensor ir RT branduoliai neužima tiek daug vietos NVIDIA Turing GPU

Net ir paskelbus pirmąsias GeForce RTX 20 serijos vaizdo plokštes, daugelis manė, kad „Turing“ GPU savo visai ne mažus matmenis lemia papildomi įrenginiai: RT branduoliai ir tenzoriniai branduoliai. Dabar vienas „Reddit“ vartotojas išanalizavo „Turing TU106“ ir „TU116“ GPU infraraudonųjų spindulių vaizdus ir padarė išvadą, kad nauji skaičiavimo blokai neužima tiek vietos, kiek manyta iš pradžių.

Tensor ir RT branduoliai neužima tiek daug vietos NVIDIA Turing GPU

Pirmiausia prisiminkime, kad Turing TU106 GPU yra jauniausias ir kompaktiškiausias NVIDIA lustas su specialiomis RT šerdimis, skirtas spindulių sekimui, ir tenzorinėmis šerdimis, kurios pagreitina dirbtinio intelekto funkcijas. Savo ruožtu iš su juo susijusio Turing TU116 grafikos procesoriaus šių specialių skaičiavimo blokų atimta ir todėl buvo nuspręsta juos palyginti.

Tensor ir RT branduoliai neužima tiek daug vietos NVIDIA Turing GPU
Tensor ir RT branduoliai neužima tiek daug vietos NVIDIA Turing GPU

NVIDIA Turing GPU skirstomi į TPC blokus, kuriuose yra pora srautinio perdavimo kelių procesorių (Streaming Multiprocessors), kuriuose jau yra visi skaičiavimo branduoliai. Ir kaip paaiškėjo, Turing TU106 GPU turi tik 1,95 mm² didesnį TPC plotą nei Turing TU116 arba 22%. Iš šio ploto 1,25 mm² skirta tenzorinėms šerdims, o tik 0,7 mm² – RT šerdims.

Tensor ir RT branduoliai neužima tiek daug vietos NVIDIA Turing GPU
Tensor ir RT branduoliai neužima tiek daug vietos NVIDIA Turing GPU

Pasirodo, be naujų tenzoriaus ir RT branduolių flagmanas Turing TU102 grafikos procesorius, kuriuo grindžiamas GeForce RTX 2080 Ti, užimtų ne 754 mm², o 684 mm² (36 TPC). Savo ruožtu Turing TU104, kuris yra GeForce RTX 2080 pagrindas, galėtų užimti 498 mm², o ne 545 mm² (24 TPC). Kaip matote, net be tenzoriaus ir RT branduolių senesni Turing GPU būtų labai dideli lustai. Žymiai daugiau Pascal GPU.


Tensor ir RT branduoliai neužima tiek daug vietos NVIDIA Turing GPU

Taigi, kokia yra tokių didelių dydžių priežastis? Pradedantiesiems Turing GPU turėjo didesnius talpyklos dydžius. Taip pat buvo padidintas šešėlių dydis, o „Turing“ lustai turi didesnius instrukcijų rinkinius ir didesnius registrus. Visa tai leido gerokai padidinti ne tik plotą, bet ir Turing GPU našumą. Pavyzdžiui, tas pats „GeForce RTX 2060“, pagrįstas TU106, užtikrina beveik tokį patį našumo lygį kaip „GeForce GTX 1080“, pagrįstas GP104. Pastarasis, beje, turi 25% didesnį CUDA branduolių skaičių, nors užima 314 mm2 plotą, palyginti su 410 mm2 naujajam TU106. 




Šaltinis: 3dnews.ru

Добавить комментарий