NVIDIA útskýrði hvers vegna GeForce RTX 30 röð eldsneytisgjöf hefur slíkt stökk í afköstum

NVIDIA kynnti nýju kynslóðina af Ampere leikjaskjákortum 1. september, en fyrstu kynningin innihélt nánast engar tæknilegar upplýsingar. Nú, nokkrum dögum síðar, hefur fyrirtækið gefið út skjöl sem skýra hvaðan hinn glæsilegi frammistöðukostur sem aðgreinir GeForce RTX 30-röð skjákortin frá forverum sínum kemur.

NVIDIA útskýrði hvers vegna GeForce RTX 30 röð eldsneytisgjöf hefur slíkt stökk í afköstum

Margir tóku strax eftir því að opinberar forskriftir GeForce RTX 3090, GeForce RTX 3080 og GeForce RTX 3070 á NVIDIA vefsíðunni gáfu til kynna ótrúlega mikinn fjölda CUDA örgjörva.

NVIDIA útskýrði hvers vegna GeForce RTX 30 röð eldsneytisgjöf hefur slíkt stökk í afköstum

Eins og það kemur í ljós á sér stað tvöföldun á FP32 afköstum Ampere leikjaörgjörva samanborið við Turing, og það tengist breytingu á arkitektúr grunnbyggingareininga GPU - straumörgjörva (SM).

NVIDIA útskýrði hvers vegna GeForce RTX 30 röð eldsneytisgjöf hefur slíkt stökk í afköstum

Þó að SM-tækin í Turing-kynslóðinni GPU hafi eina reiknileið fyrir fljótapunktsaðgerðir, í Ampere fékk hver straumörgjörvi tvær leiðir, sem samtals geta framkvæmt allt að 128 FMA aðgerðir á hverri klukkulotu á móti 64 fyrir Turing. Á sama tíma er helmingur tiltækra Ampere framkvæmdareininga fær um að framkvæma bæði heiltöluaðgerðir (INT) og 32 bita fljótandi punkta (FP32) aðgerðir, en seinni helmingur tækjanna er eingöngu ætlaður fyrir FP32 aðgerðir. Þessi aðferð var notuð til að spara smára kostnaðarhámarkið, byggt á þeirri staðreynd að leikjaálagið framkallar umtalsvert meira FP32 en INT aðgerðir. Hins vegar, í Turing, voru alls engir samsettir stýringar.


NVIDIA útskýrði hvers vegna GeForce RTX 30 röð eldsneytisgjöf hefur slíkt stökk í afköstum

Á sama tíma, til að veita auknum straumörgjörvum nauðsynlegt magn af gögnum, jók NVIDIA stærð L1 skyndiminni í SM um þriðjung (úr 96 í 128 KB) og tvöfaldaði einnig afköst þess.

Önnur mikilvæg framför í Ampere er að CUDA, RT og Tensor kjarna geta nú keyrt að fullu samhliða. Þetta gerir grafíkvélinni til dæmis kleift að nota DLSS til að skala einn ramma og á sama tíma reikna út næsta ramma á CUDA og RT kjarna, sem dregur úr niðurtíma virkra hnúta og eykur heildarafköst.

Við þetta verðum við að bæta því að önnur kynslóð RT kjarna, sem eru útfærð í Amrere, geta reiknað skurðpunkta þríhyrninga með geislum tvisvar sinnum hraðar en það gerðist í Turing. Og nýju þriðju kynslóðar tensorkjarnar hafa tvöfaldað stærðfræðilega frammistöðu þegar unnið er með dreifðar fylki.

Tvöföldun hraðans sem Ampere reiknar út þríhyrningsmót ætti að hafa veruleg áhrif á frammistöðu GeForce RTX 30-röð hraðsala í leikjum sem styðja geislarekningu. Samkvæmt NVIDIA var það þessi eiginleiki sem virkaði sem flöskuháls í Turing arkitektúrnum, en hraði útreikninga á skurðpunktum geisla afmarkandi samhliða pípu olli engum kvörtunum. Nú hefur jafnvægi á frammistöðu í rekningum verið fínstillt og ennfremur, í Ampere, er hægt að framkvæma báðar tegundir geislaaðgerða (með þríhyrningum og samhliða pípu) samhliða.

Í viðbót við þetta hefur nýrri virkni verið bætt við RT kjarna Ampere til að interpola stöðu þríhyrninga. Þetta er hægt að nota til að gera hluti á hreyfingu óskýra þegar ekki allir þríhyrningar í senu eru í stöðugri stöðu.

Til að sýna allt þetta sýndi NVIDIA beinan samanburð á því hvernig Turing og Ampere GPUs höndla geislarekningu í Wolfenstein Youngblood í 4K upplausn. Eins og kemur fram af myndskreytingunni, þá nýtur Ampere áberandi ávinning í rammabyggingarhraða, bæði vegna hraðari stærðfræðilegra FP32 útreikninga, þökk sé annarri kynslóð RT kjarna, sem og samhliða notkun misleitra GPU auðlinda.

NVIDIA útskýrði hvers vegna GeForce RTX 30 röð eldsneytisgjöf hefur slíkt stökk í afköstum

Að auki, til að nánast styrkja ofangreint, kynnti NVIDIA viðbótarprófunarniðurstöður fyrir GeForce RTX 3090, GeForce RTX 3080 og GeForce RTX 3070. Samkvæmt þeim er GeForce RTX 3070 um það bil 60% á undan GeForce RTX 2070 í 1440p upplausn, og þessi mynd sést í leikjum með RTX stuðningi og með hefðbundinni rasterization, sérstaklega í Borderlands 3.

NVIDIA útskýrði hvers vegna GeForce RTX 30 röð eldsneytisgjöf hefur slíkt stökk í afköstum

Frammistaða GeForce RTX 3080 er tvöfalt betri en GeForce RTX 2080 í 4K upplausn. Að vísu, í þessu tilviki, í Borderlands 3 án RTX-stuðnings, er kosturinn við nýja kortið ekki tvöfaldur, heldur um það bil 80 prósent.

NVIDIA útskýrði hvers vegna GeForce RTX 30 röð eldsneytisgjöf hefur slíkt stökk í afköstum

Og eldra kortið, GeForce RTX 3090, í eigin prófum NVIDIA sýnir um það bil eins og hálfs sinnum forskot á Titan RTX.

NVIDIA útskýrði hvers vegna GeForce RTX 30 röð eldsneytisgjöf hefur slíkt stökk í afköstum

Samkvæmt skýrslum frá tækniblaðamönnum eiga fullar umsagnir um GeForce RTX 3080 viðmiðunarhönnunina að vera birtar 14. september. Þremur dögum síðar, þann 17. september, verður leyfilegt að birta prófunargögn fyrir framleiðslu GeForce RTX 3080 módel frá samstarfsaðilum fyrirtækisins. Þannig er mjög lítill tími eftir til að bíða eftir að niðurstöður óháðra prófa fulltrúa GeForce RTX 30 seríunnar birtast á netinu.

Heimild:



Heimild: 3dnews.ru

Bæta við athugasemd