NVIDIA het verduidelik hoekom GeForce RTX 30-reeksversnellers so 'n sprong in werkverrigting het

NVIDIA het die nuwe generasie Ampere-speletjie-grafiese kaarte op 1 September bekendgestel, maar die aanvanklike aanbieding het byna geen tegniese besonderhede bevat nie. Nou, 'n paar dae later, het die maatskappy dokumentasie vrygestel wat verduidelik waar die indrukwekkende prestasievoordeel vandaan kom wat die GeForce RTX 30-reeks grafiese kaarte van sy voorgangers onderskei.

NVIDIA het verduidelik hoekom GeForce RTX 30-reeksversnellers so 'n sprong in werkverrigting het

Baie het dadelik opgemerk dat die amptelike spesifikasies van die GeForce RTX 3090, GeForce RTX 3080 en GeForce RTX 3070 op die NVIDIA-webwerf 'n verbysterende groot aantal CUDA-verwerkers aandui.

NVIDIA het verduidelik hoekom GeForce RTX 30-reeksversnellers so 'n sprong in werkverrigting het

Soos dit blyk, vind die verdubbeling van FP32-werkverrigting van Ampere-speletjieverwerkers in vergelyking met Turing inderdaad plaas, en dit word geassosieer met 'n verandering in die argitektuur van die basiese boustene van die GPU - stroomverwerkers (SM).

NVIDIA het verduidelik hoekom GeForce RTX 30-reeksversnellers so 'n sprong in werkverrigting het

Terwyl die SM'e in die Turing-generasie GPU's een berekeningspad vir swaaipuntbewerkings gehad het, het elke stroomverwerker in Ampere twee paaie ontvang, wat in totaal tot 128 FMA-bewerkings per kloksiklus kan uitvoer teenoor 64 vir Turing. Terselfdertyd is die helfte van die beskikbare Ampere uitvoering eenhede in staat om beide heelgetal (INT) bewerkings en 32-bis drywende punt (FP32) bewerkings uit te voer, terwyl die tweede helfte van die toestelle uitsluitlik vir FP32 bewerkings bedoel is. Hierdie benadering is gebruik om die transistorbegroting te bespaar, gebaseer op die feit dat die spellading aansienlik meer FP32 as INT-bedrywighede genereer. In Turing was daar egter glad nie gekombineerde aktueerders nie.


NVIDIA het verduidelik hoekom GeForce RTX 30-reeksversnellers so 'n sprong in werkverrigting het

Terselfdertyd, om verbeterde stroomverwerkers van die nodige hoeveelheid data te voorsien, het NVIDIA die grootte van die L1-kas in SM met 'n derde vergroot (van 96 tot 128 KB), en ook sy deurset verdubbel.

Nog 'n belangrike verbetering in Ampere is dat CUDA, RT en Tensor kerns nou ten volle parallel kan loop. Dit stel die grafiese enjin byvoorbeeld in staat om DLSS te gebruik om een ​​raam te skaal, en terselfdertyd die volgende raam op CUDA- en RT-kerne te bereken, wat stilstandtyd van funksionele nodusse verminder en algehele werkverrigting verhoog.

Hierby moet ons byvoeg dat die tweede generasie RT-kerne, wat in Amrere geïmplementeer word, snypunte van driehoeke met strale twee keer so vinnig kan bereken as wat dit in Turing gebeur het. En die nuwe derdegenerasie-tensorkerne het wiskundige prestasie verdubbel wanneer daar met yl matrikse gewerk word.

Die verdubbeling van die spoed waarteen Ampere driehoek-kruisings bereken, behoort 'n beduidende impak te hê op die werkverrigting van GeForce RTX 30-reeks versnellers in speletjies wat straalopsporing ondersteun. Volgens NVIDIA was dit hierdie eienskap wat as 'n bottelnek in die Turing-argitektuur opgetree het, terwyl die spoed van berekeninge van kruisings van strale van grensende parallelepipede geen klagtes veroorsaak het nie. Nou is die balans van prestasie in naspeuring geoptimaliseer, en bowendien, in Ampere, kan beide tipes straalbewerkings (met driehoeke en parallelepipedies) parallel uitgevoer word.

Hierbenewens is nuwe funksionaliteit by Ampere se RT-kerne gevoeg om die posisie van driehoeke te interpoleer. Dit kan gebruik word om voorwerpe in beweging te vervaag wanneer nie alle driehoeke in die toneel in 'n konstante posisie is nie.

Om dit alles te illustreer, het NVIDIA 'n direkte vergelyking getoon van hoe die Turing- en Ampere-GPU's straalsporing in Wolfenstein Youngblood met 4K-resolusie hanteer. Soos volg uit die voorgestelde illustrasie, baat Ampere merkbaar in raamkonstruksiespoed, beide as gevolg van vinniger FP32 wiskundige berekeninge, te danke aan die tweede generasie RT-kerne, sowel as die parallelle werking van heterogene GPU-hulpbronne.

NVIDIA het verduidelik hoekom GeForce RTX 30-reeksversnellers so 'n sprong in werkverrigting het

Om bogenoemde prakties te versterk, het NVIDIA addisionele toetsresultate vir die GeForce RTX 3090, GeForce RTX 3080 en GeForce RTX 3070 aangebied. Volgens hulle is die GeForce RTX 3070 ongeveer 60% voor die GeForce RTX 2070 in 1440p-resolusie, en hierdie prentjie word waargeneem in speletjies met RTX-ondersteuning, en met tradisionele rasterisering, veral in Borderlands 3.

NVIDIA het verduidelik hoekom GeForce RTX 30-reeksversnellers so 'n sprong in werkverrigting het

Die werkverrigting van die GeForce RTX 3080 is twee keer so goed as dié van die GeForce RTX 2080 teen 4K-resolusie. Dit is waar, in hierdie geval, in Borderlands 3 sonder RTX-ondersteuning, is die voordeel van die nuwe kaart nie dubbel nie, maar ongeveer 80 persent.

NVIDIA het verduidelik hoekom GeForce RTX 30-reeksversnellers so 'n sprong in werkverrigting het

En die ouer kaart, GeForce RTX 3090, in NVIDIA se eie toetse toon ongeveer een en 'n half keer voordeel bo die Titan RTX.

NVIDIA het verduidelik hoekom GeForce RTX 30-reeksversnellers so 'n sprong in werkverrigting het

Volgens verslae van tegnologiejoernaliste sal volledige resensies van die GeForce RTX 3080-verwysingsontwerp op 14 September gepubliseer word. Drie dae later, op 17 September, sal dit toegelaat word om toetsdata vir produksie GeForce RTX 3080-modelle van die maatskappy se vennote te publiseer. Daar is dus baie min tyd oor vir die resultate van onafhanklike toetse van verteenwoordigers van die GeForce RTX 30-reeks om op die internet te verskyn.

Bron:



Bron: 3dnews.ru

Voeg 'n opmerking