NVIDIA je objasnila zašto GeForce RTX 30 serija akceleratora ima takav skok u performansama

NVIDIA je 1. rujna predstavila novu generaciju grafičkih kartica Ampere za igranje, ali početna prezentacija nije sadržavala gotovo nikakve tehničke detalje. Sada, nekoliko dana kasnije, tvrtka je objavila dokumentaciju koja pojašnjava odakle dolazi impresivna prednost performansi koja grafičke kartice serije GeForce RTX 30 razlikuje od svojih prethodnika.

NVIDIA je objasnila zašto GeForce RTX 30 serija akceleratora ima takav skok u performansama

Mnogi su odmah primijetili da službene specifikacije GeForce RTX 3090, GeForce RTX 3080 i GeForce RTX 3070 na NVIDIA web stranici ukazuju na nevjerojatno velik broj CUDA procesora.

NVIDIA je objasnila zašto GeForce RTX 30 serija akceleratora ima takav skok u performansama

Kako se pokazalo, do udvostručenja FP32 performansi Ampere gaming procesora u odnosu na Turing doista dolazi, a povezano je s promjenom arhitekture osnovnih građevnih blokova GPU-a – stream procesora (SM).

NVIDIA je objasnila zašto GeForce RTX 30 serija akceleratora ima takav skok u performansama

Dok su SM-ovi u Turing generaciji GPU-a imali jednu računsku stazu za operacije s pomičnim zarezom, u Ampereu je svaki stream procesor dobio dvije staze, koje ukupno mogu izvesti do 128 FMA operacija po ciklusu takta naspram 64 za Turing. Istodobno, polovica dostupnih Ampere izvršnih jedinica sposobna je izvoditi i cjelobrojne (INT) operacije i 32-bitne operacije s pomičnim zarezom (FP32), dok je druga polovica uređaja namijenjena isključivo za FP32 operacije. Ovaj pristup korišten je za uštedu proračuna tranzistora, na temelju činjenice da opterećenje igara generira znatno više FP32 nego INT operacija. Međutim, u Turingu uopće nije bilo kombiniranih aktuatora.


NVIDIA je objasnila zašto GeForce RTX 30 serija akceleratora ima takav skok u performansama

U isto vrijeme, kako bi poboljšanim stream procesorima pružila potrebnu količinu podataka, NVIDIA je povećala veličinu L1 predmemorije u SM-u za trećinu (s 96 na 128 KB), a također je udvostručila njegovu propusnost.

Još jedno važno poboljšanje u Ampereu je da jezgre CUDA, RT i Tensor sada mogu raditi potpuno paralelno. To grafičkom pogonu omogućuje, na primjer, korištenje DLSS-a za skaliranje jednog okvira i istovremeno izračunavanje sljedećeg okvira na CUDA i RT jezgrama, smanjujući vrijeme zastoja funkcionalnih čvorova i povećavajući ukupnu izvedbu.

Ovome moramo dodati da RT jezgre druge generacije, koje su implementirane u Amrereu, mogu izračunati sjecišta trokuta sa zrakama dvostruko brže nego što se to dogodilo u Turingu. A nove tenzorske jezgre treće generacije imaju udvostručenu matematičku izvedbu pri radu s rijetkim matricama.

Udvostručenje brzine kojom Ampere izračunava sjecišta trokuta trebalo bi imati značajan utjecaj na performanse GeForce RTX 30-serije akceleratora u igrama koje podržavaju praćenje zraka. Prema NVIDIA-i, upravo je ova karakteristika djelovala kao usko grlo u Turingovoj arhitekturi, dok brzina izračunavanja sjecišta zraka graničnih paralelopipeda nije izazvala nikakve pritužbe. Sada je ravnoteža performansi u praćenju optimizirana, a štoviše, u Ampereu se obje vrste operacija zraka (s trokutima i paralelopipedima) mogu izvoditi paralelno.

Uz to, Ampereovim RT jezgrama dodana je nova funkcionalnost za interpolaciju položaja trokuta. Ovo se može koristiti za zamućivanje objekata u pokretu kada nisu svi trokuti u sceni u stalnom položaju.

Kako bi ilustrirala sve ovo, NVIDIA je pokazala izravnu usporedbu kako Turing i Ampere GPU upravljaju praćenjem zraka u Wolfenstein Youngbloodu u 4K rezoluciji. Kao što slijedi iz prikazane ilustracije, Ampere ima primjetnu prednost u brzini konstrukcije okvira kako zbog bržih matematičkih FP32 izračuna, zahvaljujući drugoj generaciji RT jezgri, tako i zbog paralelnog rada heterogenih GPU resursa.

NVIDIA je objasnila zašto GeForce RTX 30 serija akceleratora ima takav skok u performansama

Osim toga, kako bi praktično potvrdili gore navedeno, NVIDIA je predstavila dodatne rezultate testova za GeForce RTX 3090, GeForce RTX 3080 i GeForce RTX 3070. Prema njima, GeForce RTX 3070 je otprilike 60% ispred GeForce RTX 2070 u 1440p rezoluciji, a ova se slika primjećuje u igrama s RTX podrškom i tradicionalnom rasterizacijom, posebice u Borderlands 3.

NVIDIA je objasnila zašto GeForce RTX 30 serija akceleratora ima takav skok u performansama

Performanse GeForce RTX 3080 dvostruko su bolje od GeForce RTX 2080 u 4K rezoluciji. Istina, u ovom slučaju, u Borderlands 3 bez RTX podrške, prednost nove kartice nije dvostruka, već otprilike 80 posto.

NVIDIA je objasnila zašto GeForce RTX 30 serija akceleratora ima takav skok u performansama

A starija kartica, GeForce RTX 3090, u NVIDIA-inim vlastitim testovima pokazuje otprilike jedan i pol puta prednost u odnosu na Titan RTX.

NVIDIA je objasnila zašto GeForce RTX 30 serija akceleratora ima takav skok u performansama

Prema izvješćima tehnoloških novinara, pune recenzije referentnog dizajna GeForce RTX 3080 trebale bi biti objavljene 14. rujna. Tri dana kasnije, 17. rujna, bit će dopušteno objavljivanje testnih podataka za proizvodne modele GeForce RTX 3080 od partnera tvrtke. Dakle, ostalo je vrlo malo vremena za čekanje da se na internetu pojave rezultati neovisnih testova predstavnika serije GeForce RTX 30.

Izvor:



Izvor: 3dnews.ru

Dodajte komentar