NVIDIA selgitas, miks GeForce RTX 30 seeria kiirenditel on nii suur jõudlushüpe

NVIDIA tutvustas 1. septembril mänguritele mõeldud uue põlvkonna Ampere graafikakaarte, kuid esialgne esitlus ei sisaldanud peaaegu mingeid tehnilisi detaile. Nüüd, mõni päev hiljem, avaldas ettevõte dokumentatsiooni, mis selgitab, kust pärineb muljetavaldav jõudluse eelis, mis eristab GeForce RTX 30-seeria graafikakaarte eelkäijatest.

NVIDIA selgitas, miks GeForce RTX 30 seeria kiirenditel on nii suur jõudlushüpe

Paljud märkasid kohe, et GeForce RTX 3090, GeForce RTX 3080 ja GeForce RTX 3070 ametlikud spetsifikatsioonid NVIDIA veebisaidil viitasid vapustavalt suurele arvule CUDA protsessoreid.

NVIDIA selgitas, miks GeForce RTX 30 seeria kiirenditel on nii suur jõudlushüpe

Nagu selgub, toimub Ampere mänguprotsessorite FP32 jõudluse kahekordistumine võrreldes Turingiga tõepoolest ja see on seotud GPU põhiliste ehitusplokkide - vooprotsessorite (SM) - arhitektuuri muutumisega.

NVIDIA selgitas, miks GeForce RTX 30 seeria kiirenditel on nii suur jõudlushüpe

Kui Turingi põlvkonna GPU-de SM-idel oli ujukomaoperatsioonide jaoks üks arvutustee, siis amprites sai iga vooprotsessor kaks teed, mis kokku suudavad teha kuni 128 FMA-toimingut taktsageduse kohta, Turingi puhul aga 64. Samal ajal on pooled saadaolevatest Ampere täitmisüksustest võimelised sooritama nii täisarvu (INT) kui ka 32-bitise ujukoma (FP32) toiminguid, teine ​​pool seadmetest on aga mõeldud eranditult FP32 toimingute jaoks. Seda lähenemist kasutati transistori eelarve säästmiseks, tuginedes asjaolule, et mängukoormus genereerib oluliselt rohkem FP32 kui INT-operatsioone. Turingis polnud aga kombineeritud ajamid üldse.


NVIDIA selgitas, miks GeForce RTX 30 seeria kiirenditel on nii suur jõudlushüpe

Samal ajal suurendas NVIDIA täiustatud vooprotsessoritele vajaliku andmemahuga varustamiseks kolmandiku võrra SM-i L1 vahemälu suurust (96-lt 128 KB-le) ja kahekordistas ka selle läbilaskevõimet.

Veel üks oluline edasiminek Ampere'is on see, et CUDA, RT ja Tensori tuumad saavad nüüd töötada täielikult paralleelselt. See võimaldab graafikamootoril näiteks kasutada DLSS-i ühe kaadri skaleerimiseks ja samal ajal järgmise kaadri arvutamiseks CUDA ja RT tuumadel, vähendades funktsionaalsete sõlmede seisakuaega ja suurendades üldist jõudlust.

Sellele tuleb lisada, et teise põlvkonna RT-südamikud, mida rakendatakse Amreres, suudavad arvutada kolmnurkade lõiked kiirtega kaks korda kiiremini, kui see juhtus Turingis. Ja uued kolmanda põlvkonna tensortuumad on kahekordistanud matemaatilist jõudlust hõredate maatriksitega töötamisel.

Kiiruse kahekordistamine, millega Ampere arvutab kolmnurga ristumiskohti, peaks märkimisväärselt mõjutama GeForce RTX 30-seeria kiirendite jõudlust mängudes, mis toetavad kiirte jälgimist. NVIDIA andmetel toimis just see omadus Turingi arhitektuuri kitsaskohana, samas kui paralleelsete rööptahukate kiirte ristumiskohtade arvutuste kiirus ei tekitanud kaebusi. Nüüd on jälgimise jõudluse tasakaal optimeeritud ja pealegi saab Amperes paralleelselt sooritada mõlemat tüüpi kiiroperatsioone (kolmnurkade ja rööptahukatega).

Lisaks sellele on Ampere'i RT tuumadele lisatud uus funktsionaalsus kolmnurkade asukoha interpoleerimiseks. Seda saab kasutada liikuvate objektide hägundamiseks, kui stseeni kõik kolmnurgad ei ole püsivas asendis.

Selle kõige illustreerimiseks näitas NVIDIA otsest võrdlust selle kohta, kuidas Turingi ja Ampere'i GPU-d käsitlevad Wolfenstein Youngblood 4K eraldusvõimega kiirte jälgimist. Nagu näidatud illustratsioonist järeldub, saab Ampere märgatavalt kasu raami ehitamise kiirusest nii tänu kiirematele FP32 arvutustele tänu teise põlvkonna RT-tuumadele kui ka heterogeensete GPU ressursside paralleelsele tööle.

NVIDIA selgitas, miks GeForce RTX 30 seeria kiirenditel on nii suur jõudlushüpe

Lisaks esitas NVIDIA ülaltoodu praktiliseks tugevdamiseks täiendavaid testitulemusi GeForce RTX 3090, GeForce RTX 3080 ja GeForce RTX 3070 kohta. Nende sõnul edestab GeForce RTX 3070 GeForce RTX 60 eraldusvõimega 2070p ligikaudu 1440%. ja seda pilti täheldatakse RTX-toega ja traditsioonilise rasterdamisega mängudes, eriti mängus Borderlands 3.

NVIDIA selgitas, miks GeForce RTX 30 seeria kiirenditel on nii suur jõudlushüpe

GeForce RTX 3080 jõudlus on 2080K eraldusvõimega kaks korda parem kui GeForce RTX 4 oma. Tõsi, antud juhul pole RTX-toeta Borderlands 3-s uue kaardi eelis mitte topelt, vaid ligikaudu 80 protsenti.

NVIDIA selgitas, miks GeForce RTX 30 seeria kiirenditel on nii suur jõudlushüpe

Ja vanem kaart, GeForce RTX 3090, näitab NVIDIA enda testides umbes pooleteisekordset eelist Titan RTX-i ees.

NVIDIA selgitas, miks GeForce RTX 30 seeria kiirenditel on nii suur jõudlushüpe

Tehnikaajakirjanike aruannete kohaselt avaldatakse GeForce RTX 3080 võrdlusdisaini täielikud ülevaated 14. septembril. Kolm päeva hiljem, 17. septembril, on lubatud avaldada ettevõtte partnerite GeForce RTX 3080 tootmismudelite testiandmed. Seega jääb väga vähe aega oodata GeForce RTX 30 seeria esindajate sõltumatute testide tulemuste internetti ilmumist.

Allikas:



Allikas: 3dnews.ru

Lisa kommentaar