NVIDIAk azaldu zuen zergatik duten GeForce RTX 30 serieko azeleragailuek errendimenduan halako jauzi bat

NVIDIAk irailaren 1ean aurkeztu zuen Ampere joko-txartel grafikoen belaunaldi berria, baina hasierako aurkezpenak ez zuen ia xehetasun teknikorik. Orain, egun batzuk geroago, konpainiak GeForce RTX 30 serieko txartel grafikoak aurrekoetatik bereizten dituen errendimendu abantaila ikusgarria nondik datorren argitzen duen dokumentazioa kaleratu du.

NVIDIAk azaldu zuen zergatik duten GeForce RTX 30 serieko azeleragailuek errendimenduan halako jauzi bat

Askok berehala ohartu ziren GeForce RTX 3090, GeForce RTX 3080 eta GeForce RTX 3070-en zehaztapen ofizialek NVIDIA webgunean CUDA prozesadore kopuru izugarria adierazten zutela.

NVIDIAk azaldu zuen zergatik duten GeForce RTX 30 serieko azeleragailuek errendimenduan halako jauzi bat

Ikusten denez, Ampere joko-prozesadoreen FP32 errendimendua bikoiztu egiten da Turingekin alderatuta, eta GPUaren oinarrizko eraikuntza-blokeen arkitektura aldaketarekin lotuta dago: korronte-prozesadoreak (SM).

NVIDIAk azaldu zuen zergatik duten GeForce RTX 30 serieko azeleragailuek errendimenduan halako jauzi bat

Turing belaunaldiko GPUetako SMek koma mugikorreko eragiketetarako bide konputazional bat zuten bitartean, Ampere-n korronte-prozesadore bakoitzak bi bide jaso zituen, eta guztira 128 FMA eragiketa egin ditzakete erloju-ziklo bakoitzeko 64 Turingen aldean. Aldi berean, eskuragarri dauden Ampere exekuzio-unitateen erdiak osoko (INT) eragiketak eta 32 biteko koma mugikorreko (FP32) eragiketak egiteko gai dira, eta gailuen bigarren erdia FP32 eragiketetarako soilik dago zuzenduta. Ikuspegi hau transistoreen aurrekontua aurrezteko erabili zen, jokoaren kargak INT eragiketak baino FP32 nabarmen gehiago sortzen duela kontuan hartuta. Hala ere, Turingen ez zegoen batere eragingailu konbinaturik.


NVIDIAk azaldu zuen zergatik duten GeForce RTX 30 serieko azeleragailuek errendimenduan halako jauzi bat

Aldi berean, korronte-prozesadore hobetuei beharrezko datu-kopurua eskaintzeko, NVIDIAk heren batean handitu zuen L1 cachearen tamaina SM-n (96tik 128 KB-ra), eta bikoiztu egin zuen ere.

Ampere-n beste hobekuntza garrantzitsu bat CUDA, RT eta Tensor nukleoak orain guztiz paraleloan exekutatu daitezkeela da. Honi esker, motor grafikoari, adibidez, DLSS erabil dezake fotograma bat eskalatzeko, eta, aldi berean, hurrengo fotograma kalkulatu CUDA eta RT nukleoetan, nodo funtzionalen geldialdi-denbora murriztuz eta errendimendu orokorra handituz.

Horri gehitu behar diogu bigarren belaunaldiko RT nukleoek, Amreren inplementatzen direnek, Turingen gertatu zena baino bi aldiz azkarrago kalkula ditzaketela izpidun triangeluen ebakidurak. Eta hirugarren belaunaldiko tentsore-nukleo berriek errendimendu matematikoa bikoiztu egin dute matrize urrikoekin lan egitean.

Ampere-k triangelu ebakidurak kalkulatzen dituen abiadura bikoizteak eragin handia izan beharko luke GeForce RTX 30 serieko azeleragailuen errendimenduan izpien trazamendua onartzen duten jokoetan. NVIDIAren arabera, ezaugarri hori izan zen Turingen arkitekturan botila-lepo gisa jokatu zuena, paralelepipedo mugatuen izpien gurutzaketen kalkuluen abiadurak ez zuen kexarik sortu. Orain trazatzeko errendimenduaren balantzea optimizatu da, eta, gainera, Ampere-n, bi izpi-eragiketak (triangeluekin eta paralelepipedoekin) paraleloan egin daitezke.

Honetaz gain, Ampereren RT nukleoei funtzionalitate berriak gehitu zaizkie triangeluen posizioa interpolatzeko. Hau mugimenduan dauden objektuak lausotzeko erabil daiteke eszenako triangelu guztiak etengabeko posizioan ez daudenean.

Hori guztia ilustratzeko, NVIDIAk Turing eta Ampere GPU-ek Wolfenstein Youngblood-en izpien trazamendua nola kudeatzen duten konparazio zuzena erakutsi zuen 4K bereizmenarekin. Aurkeztutako ilustraziotik ondorioztatzen denez, Ampere-k markoaren eraikuntza-abiaduran onura handia du bai FP32 kalkulu matematiko azkarragoak direla eta, bigarren belaunaldiko RT nukleoei esker, bai GPU baliabide heterogeneoen funtzionamendu paraleloari esker.

NVIDIAk azaldu zuen zergatik duten GeForce RTX 30 serieko azeleragailuek errendimenduan halako jauzi bat

Gainera, aurrekoa ia indartzeko, NVIDIAk GeForce RTX 3090, GeForce RTX 3080 eta GeForce RTX 3070-ren proba-emaitza osagarriak aurkeztu zituen. Horien arabera, GeForce RTX 3070 GeForce RTX 60 2070p bereizmenarekin baino % 1440 baino gehiago aurreratu du, gutxi gorabehera. eta irudi hau RTX euskarria duten jokoetan eta rasterizazio tradizionalarekin ikusten da, bereziki Borderlands 3-n.

NVIDIAk azaldu zuen zergatik duten GeForce RTX 30 serieko azeleragailuek errendimenduan halako jauzi bat

GeForce RTX 3080-ren errendimendua GeForce RTX 2080arena baino bi aldiz handiagoa da 4K bereizmenarekin. Egia da, kasu honetan, Borderlands 3-n RTX laguntzarik gabe, txartel berriaren abantaila ez da bikoitza, ehuneko 80koa baizik.

NVIDIAk azaldu zuen zergatik duten GeForce RTX 30 serieko azeleragailuek errendimenduan halako jauzi bat

Eta txartel zaharragoak, GeForce RTX 3090, NVIDIAren probetan, gutxi gorabehera, aldiz eta erdiko abantaila erakusten du Titan RTXarekiko.

NVIDIAk azaldu zuen zergatik duten GeForce RTX 30 serieko azeleragailuek errendimenduan halako jauzi bat

Kazetari teknologikoen txostenen arabera, GeForce RTX 3080 erreferentzia-diseinuaren berrikuspen osoak irailaren 14an argitaratuko dira. Hiru egun geroago, irailaren 17an, konpainiaren bazkideen GeForce RTX 3080 modeloen ekoizpeneko proba datuak argitaratzeko baimena izango da. Beraz, denbora gutxi geratzen da GeForce RTX 30 serieko ordezkarien proba independenteen emaitzak Interneten agertu arte itxaroteko.

Iturria:



Iturria: 3dnews.ru

Gehitu iruzkin berria