Tensor un RT kodoli neaizņem tik daudz vietas NVIDIA Turing GPU

Pat pirmo GeForce RTX 20 sērijas video karšu izziņošanas laikā daudzi uzskatīja, ka Turing GPU nepavisam ne mazie izmēri ir parādā papildu vienību klātbūtnei: RT kodoli un tenzoru kodoli. Tagad viens Reddit lietotājs ir analizējis Turing TU106 un TU116 GPU infrasarkanos attēlus un secinājis, ka jaunās skaitļošanas vienības neaizņem tik daudz vietas, kā sākotnēji tika uzskatīts.

Tensor un RT kodoli neaizņem tik daudz vietas NVIDIA Turing GPU

Sākumā atcerēsimies, ka Turing TU106 GPU ir jaunākā un kompaktākā NVIDIA mikroshēma ar īpašiem RT kodoliem staru izsekošanas nodrošināšanai un tenzora kodoliem mākslīgā intelekta funkciju paātrināšanai. Savukārt ar to saistītajam Turing TU116 grafikas procesoram šīs speciālās skaitļošanas vienības ir atņemtas un tāpēc tika nolemts tās salīdzināt.

Tensor un RT kodoli neaizņem tik daudz vietas NVIDIA Turing GPU
Tensor un RT kodoli neaizņem tik daudz vietas NVIDIA Turing GPU

NVIDIA Turing GPU ir sadalīti TPC vienībās, kas ietver pāris straumēšanas daudzprocesorus (Streaming Multiprocessors), kas jau ietver visus skaitļošanas kodolus. Un, kā izrādās, Turing TU106 GPU ir tikai par 1,95 mm² lielāks TPC laukums nekā Turing TU116 jeb 22%. No šī laukuma 1,25 mm² ir paredzēts tenzora serdeņiem, un tikai 0,7 mm² ir paredzēts RT serdeņiem.

Tensor un RT kodoli neaizņem tik daudz vietas NVIDIA Turing GPU
Tensor un RT kodoli neaizņem tik daudz vietas NVIDIA Turing GPU

Izrādās, ka bez jaunajiem tenzoriem un RT kodoliem flagmanis Turing TU102 grafikas procesors, kas ir GeForce RTX 2080 Ti pamatā, aizņemtu nevis 754 mm², bet 684 mm² (36 TPC). Savukārt Turing TU104, kas ir GeForce RTX 2080 pamatā, varētu aizņemt 498 mm², nevis 545 mm² (24 TPC). Kā redzat, pat bez tenzora un RT kodoliem vecāki Turing GPU būtu ļoti lieli mikroshēmas. Ievērojami vairāk Pascal GPU.


Tensor un RT kodoli neaizņem tik daudz vietas NVIDIA Turing GPU

Tātad, kāds ir iemesls tik ievērojamam izmēram? Iesācējiem Turing GPU ir bijuši lielāki kešatmiņas izmēri. Ir palielināts arī ēnotāju izmērs, un Tjūringa mikroshēmām ir lielākas instrukciju kopas un lielāki reģistri. Tas viss ļāva ievērojami palielināt ne tikai laukumu, bet arī Turing GPU veiktspēju. Piemēram, tas pats GeForce RTX 2060, kura pamatā ir TU106, nodrošina gandrīz tādu pašu veiktspējas līmeni kā GeForce GTX 1080, kura pamatā ir GP104. Pēdējam, starp citu, ir par 25% lielāks CUDA serdeņu skaits, lai gan tas aizņem 314 mm2 platību, salīdzinot ar 410 mm2 jaunajam TU106. 




Avots: 3dnews.ru

Pievieno komentāru