NVIDIA je pojasnila, zakaj imajo pospeševalniki serije GeForce RTX 30 tak preskok v zmogljivosti

NVIDIA je 1. septembra predstavila novo generacijo igralnih grafičnih kartic Ampere, vendar prvotna predstavitev ni vsebovala skoraj nobenih tehničnih podrobnosti. Zdaj, nekaj dni kasneje, je podjetje izdalo dokumentacijo, ki pojasnjuje, od kod izvira impresivna prednost v zmogljivosti, ki grafične kartice serije GeForce RTX 30 loči od svojih predhodnikov.

NVIDIA je pojasnila, zakaj imajo pospeševalniki serije GeForce RTX 30 tak preskok v zmogljivosti

Mnogi so takoj opazili, da uradne specifikacije GeForce RTX 3090, GeForce RTX 3080 in GeForce RTX 3070 na spletnem mestu NVIDIA kažejo osupljivo veliko število procesorjev CUDA.

NVIDIA je pojasnila, zakaj imajo pospeševalniki serije GeForce RTX 30 tak preskok v zmogljivosti

Kot kaže, do podvojitve zmogljivosti FP32 igralnih procesorjev Ampere v primerjavi s Turingom res pride, povezano pa je s spremembo arhitekture osnovnih gradnikov GPU – pretočnih procesorjev (SM).

NVIDIA je pojasnila, zakaj imajo pospeševalniki serije GeForce RTX 30 tak preskok v zmogljivosti

Medtem ko so imeli SM-ji v grafičnih procesorjih generacije Turing eno računsko pot za operacije s plavajočo vejico, je v Ampereju vsak pretočni procesor prejel dve poti, ki lahko skupaj izvedeta do 128 operacij FMA na takt v primerjavi s 64 pri Turingu. Pri tem je polovica razpoložljivih izvršilnih enot Ampere sposobna izvajati tako celoštevilske (INT) operacije kot 32-bitne operacije s plavajočo vejico (FP32), medtem ko je druga polovica naprav namenjena izključno operacijam FP32. Ta pristop je bil uporabljen za prihranek proračuna za tranzistorje na podlagi dejstva, da igralna obremenitev ustvari znatno več operacij FP32 kot operacij INT. Vendar v Turingu sploh ni bilo kombiniranih aktuatorjev.


NVIDIA je pojasnila, zakaj imajo pospeševalniki serije GeForce RTX 30 tak preskok v zmogljivosti

Hkrati je NVIDIA, da bi izboljšanim pretočnim procesorjem zagotovila potrebno količino podatkov, povečala velikost predpomnilnika L1 v SM za tretjino (s 96 na 128 KB) in podvojila njegovo prepustnost.

Druga pomembna izboljšava v Ampere je, da lahko jedra CUDA, RT in Tensor zdaj delujejo popolnoma vzporedno. To omogoča grafičnemu mehanizmu, da na primer uporabi DLSS za skaliranje enega okvirja in hkrati izračuna naslednji okvir na jedrih CUDA in RT, s čimer zmanjša čas izpadov funkcionalnih vozlišč in poveča splošno zmogljivost.

K temu moramo dodati, da lahko druga generacija RT jeder, ki so implementirana v Amrereju, izračuna presečišča trikotnikov z žarki dvakrat hitreje, kot se je to zgodilo v Turingu. In nova tenzorska jedra tretje generacije so podvojila matematično zmogljivost pri delu z redkimi matrikami.

Podvojitev hitrosti, s katero Ampere izračuna presečišča trikotnikov, bi moralo pomembno vplivati ​​na zmogljivost pospeševalnikov serije GeForce RTX 30 v igrah, ki podpirajo sledenje žarkom. Po mnenju NVIDIA je bila ta značilnost, ki je delovala kot ozko grlo v arhitekturi Turing, medtem ko hitrost izračunov presečišč žarkov mejnih paralelepipedov ni povzročila nobenih pritožb. Zdaj je bilo ravnovesje zmogljivosti pri sledenju optimizirano, poleg tega pa je v Ampere mogoče vzporedno izvajati obe vrsti žarkovnih operacij (s trikotniki in paralelopipedi).

Poleg tega je bila jedrom Ampere RT dodana nova funkcionalnost za interpolacijo položaja trikotnikov. To lahko uporabite za zameglitev premikajočih se predmetov, ko vsi trikotniki v prizoru niso v stalnem položaju.

Za ponazoritev vsega tega je NVIDIA prikazala neposredno primerjavo, kako grafični procesorji Turing in Ampere obravnavata sledenje žarkom v Wolfenstein Youngblood pri ločljivosti 4K. Kot je razvidno iz predstavljene ilustracije, Ampere opazno izboljša hitrost gradnje okvirja tako zaradi hitrejših matematičnih izračunov FP32, zahvaljujoč jedrim RT druge generacije, kot tudi zaradi vzporednega delovanja heterogenih virov GPU.

NVIDIA je pojasnila, zakaj imajo pospeševalniki serije GeForce RTX 30 tak preskok v zmogljivosti

Poleg tega je NVIDIA za praktično okrepitev zgoraj navedenega predstavila dodatne rezultate testov za GeForce RTX 3090, GeForce RTX 3080 in GeForce RTX 3070. Po njihovem mnenju je GeForce RTX 3070 približno 60 % pred GeForce RTX 2070 v ločljivosti 1440p, in to sliko opazimo v igrah s podporo RTX in s tradicionalno rastrizacijo, zlasti v Borderlands 3.

NVIDIA je pojasnila, zakaj imajo pospeševalniki serije GeForce RTX 30 tak preskok v zmogljivosti

Zmogljivost GeForce RTX 3080 je dvakrat boljša od zmogljivosti GeForce RTX 2080 pri ločljivosti 4K. Res je, da v tem primeru v Borderlands 3 brez podpore RTX prednost nove kartice ni dvojna, ampak približno 80-odstotna.

NVIDIA je pojasnila, zakaj imajo pospeševalniki serije GeForce RTX 30 tak preskok v zmogljivosti

In starejša kartica, GeForce RTX 3090, v lastnih testih NVIDIA kaže približno enoinpolkratno prednost pred Titan RTX.

NVIDIA je pojasnila, zakaj imajo pospeševalniki serije GeForce RTX 30 tak preskok v zmogljivosti

Glede na poročila tehnoloških novinarjev naj bi bile popolne ocene referenčne zasnove GeForce RTX 3080 objavljene 14. septembra. Tri dni kasneje, 17. septembra, bo dovoljeno objaviti testne podatke za proizvodne modele GeForce RTX 3080 od partnerjev podjetja. Tako je ostalo zelo malo časa za čakanje, da se na internetu pojavijo rezultati neodvisnih testov predstavnikov serije GeForce RTX 30.

Vir:



Vir: 3dnews.ru

Dodaj komentar