Ipinaliwanag ng NVIDIA kung bakit ang mga accelerator ng serye ng GeForce RTX 30 ay may ganoong paglukso sa pagganap

Ipinakilala ng NVIDIA ang bagong henerasyon ng mga Ampere gaming graphics card noong Setyembre 1, ngunit ang paunang pagtatanghal ay naglalaman ng halos walang mga teknikal na detalye. Ngayon, makalipas ang ilang araw, ang kumpanya ay naglabas ng dokumentasyon na naglilinaw kung saan nagmumula ang kahanga-hangang performance advantage na nagtatakda sa GeForce RTX 30-series graphics card bukod sa mga nauna nito.

Ipinaliwanag ng NVIDIA kung bakit ang mga accelerator ng serye ng GeForce RTX 30 ay may ganoong paglukso sa pagganap

Agad na napansin ng marami na ang mga opisyal na pagtutukoy ng GeForce RTX 3090, GeForce RTX 3080 at GeForce RTX 3070 sa website ng NVIDIA ay nagpahiwatig ng napakalaking bilang ng mga processor ng CUDA.

Ipinaliwanag ng NVIDIA kung bakit ang mga accelerator ng serye ng GeForce RTX 30 ay may ganoong paglukso sa pagganap

Sa lumalabas, ang pagdodoble ng pagganap ng FP32 ng mga processor ng paglalaro ng Ampere kumpara sa Turing ay talagang nangyayari, at ito ay nauugnay sa isang pagbabago sa arkitektura ng mga pangunahing bloke ng gusali ng GPU - stream processors (SM).

Ipinaliwanag ng NVIDIA kung bakit ang mga accelerator ng serye ng GeForce RTX 30 ay may ganoong paglukso sa pagganap

Habang ang mga SM sa Turing generation GPU ay may isang computational path para sa floating point operations, sa Ampere bawat stream processor ay nakatanggap ng dalawang path, na sa kabuuan ay maaaring magsagawa ng hanggang 128 FMA operations bawat clock cycle kumpara sa 64 para sa Turing. Kasabay nito, kalahati ng mga available na Ampere execution unit ay may kakayahang magsagawa ng parehong integer (INT) operations at 32-bit floating point (FP32) operations, habang ang pangalawang kalahati ng mga device ay sadyang inilaan para sa FP32 operations. Ginamit ang diskarte na ito upang i-save ang badyet ng transistor, batay sa katotohanan na ang gaming load ay bumubuo ng mas maraming FP32 kaysa sa mga operasyon ng INT. Gayunpaman, sa Turing ay walang pinagsamang mga actuator.


Ipinaliwanag ng NVIDIA kung bakit ang mga accelerator ng serye ng GeForce RTX 30 ay may ganoong paglukso sa pagganap

Kasabay nito, upang makapagbigay ng mga pinahusay na stream processor na may kinakailangang dami ng data, pinalaki ng NVIDIA ang laki ng L1 cache sa SM ng isang pangatlo (mula 96 hanggang 128 KB), at nadoble rin ang throughput nito.

Ang isa pang mahalagang pagpapabuti sa Ampere ay ang mga core ng CUDA, RT at Tensor ay maaari na ngayong ganap na tumakbo nang magkatulad. Nagbibigay-daan ito sa graphics engine, halimbawa, na gumamit ng DLSS upang sukatin ang isang frame, at kasabay nito ay kalkulahin ang susunod na frame sa mga core ng CUDA at RT, na binabawasan ang downtime ng mga functional node at pinapataas ang pangkalahatang pagganap.

Dito dapat nating idagdag na ang ikalawang henerasyong mga RT core, na ipinatupad sa Amrere, ay maaaring kalkulahin ang mga intersection ng mga tatsulok na may ray nang dalawang beses nang mas mabilis kaysa nangyari sa Turing. At ang mga bagong third-generation tensor core ay nagdoble ng mathematical performance kapag nagtatrabaho sa mga sparse matrice.

Ang pagdodoble sa bilis ng pagkalkula ng Ampere sa mga tatsulok na intersection ay dapat magkaroon ng malaking epekto sa pagganap ng GeForce RTX 30-series accelerators sa mga larong sumusuporta sa ray tracing. Ayon sa NVIDIA, ang katangiang ito ang kumilos bilang isang bottleneck sa arkitektura ng Turing, habang ang bilis ng mga kalkulasyon ng mga intersection ng mga sinag ng nagbubuklod na parallelepiped ay hindi nagtaas ng anumang mga reklamo. Ngayon ang balanse ng pagganap sa pagsubaybay ay na-optimize, at bukod dito, sa Ampere, ang parehong mga uri ng mga operasyon ng ray (na may mga tatsulok at parallelepiped) ay maaaring gumanap nang magkatulad.

Bilang karagdagan dito, ang bagong functionality ay idinagdag sa mga RT core ng Ampere upang i-interpolate ang posisyon ng mga triangles. Magagamit ito upang i-blur ang mga bagay na gumagalaw kapag hindi lahat ng mga tatsulok sa eksena ay nasa pare-parehong posisyon.

Upang ilarawan ang lahat ng ito, nagpakita ang NVIDIA ng direktang paghahambing kung paano pinangangasiwaan ng Turing at Ampere GPU ang ray tracing sa Wolfenstein Youngblood sa 4K na resolusyon. Tulad ng mga sumusunod mula sa ipinakita na ilustrasyon, ang Ampere ay kapansin-pansing nakikinabang sa bilis ng pagbuo ng frame kapwa dahil sa mas mabilis na mathematical na FP32 na mga kalkulasyon, salamat sa ikalawang henerasyong mga RT core, pati na rin ang parallel na operasyon ng magkakaibang mga mapagkukunan ng GPU.

Ipinaliwanag ng NVIDIA kung bakit ang mga accelerator ng serye ng GeForce RTX 30 ay may ganoong paglukso sa pagganap

Bilang karagdagan, upang praktikal na mapalakas ang nasa itaas, ipinakita ng NVIDIA ang mga karagdagang resulta ng pagsubok para sa GeForce RTX 3090, GeForce RTX 3080 at GeForce RTX 3070. Ayon sa kanila, ang GeForce RTX 3070 ay humigit-kumulang 60% nangunguna sa GeForce RTX 2070 sa 1440p na resolusyon, at ang larawang ito ay sinusunod sa mga laro na may suporta sa RTX, at may tradisyonal na rasterization, lalo na sa Borderlands 3.

Ipinaliwanag ng NVIDIA kung bakit ang mga accelerator ng serye ng GeForce RTX 30 ay may ganoong paglukso sa pagganap

Ang pagganap ng GeForce RTX 3080 ay dalawang beses na mas mahusay kaysa sa GeForce RTX 2080 sa 4K na resolusyon. Totoo, sa kasong ito, sa Borderlands 3 na walang suporta sa RTX, ang bentahe ng bagong card ay hindi doble, ngunit humigit-kumulang 80 porsyento.

Ipinaliwanag ng NVIDIA kung bakit ang mga accelerator ng serye ng GeForce RTX 30 ay may ganoong paglukso sa pagganap

At ang mas lumang card, GeForce RTX 3090, sa sariling mga pagsubok ng NVIDIA ay nagpapakita ng humigit-kumulang isa at kalahating beses na kalamangan sa Titan RTX.

Ipinaliwanag ng NVIDIA kung bakit ang mga accelerator ng serye ng GeForce RTX 30 ay may ganoong paglukso sa pagganap

Ayon sa mga ulat mula sa mga tech na mamamahayag, ang buong pagsusuri ng GeForce RTX 3080 na disenyo ng sanggunian ay dapat na mai-publish sa Setyembre 14. Makalipas ang tatlong araw, sa Setyembre 17, papayagan itong mag-publish ng data ng pagsubok para sa produksyon na mga modelo ng GeForce RTX 3080 mula sa mga kasosyo ng kumpanya. Kaya, napakakaunting oras na natitira upang maghintay para sa mga resulta ng mga independiyenteng pagsusuri ng mga kinatawan ng serye ng GeForce RTX 30 na lumitaw sa Internet.

Pinagmulan:



Pinagmulan: 3dnews.ru

Magdagdag ng komento