NVIDIA ilielezea kwa nini vichapuzi vya mfululizo wa GeForce RTX 30 vina kiwango kikubwa cha utendaji

NVIDIA ilianzisha kizazi kipya cha kadi za picha za michezo ya kubahatisha ya Ampere mnamo Septemba 1, lakini wasilisho la awali halikuwa na maelezo yoyote ya kiufundi. Sasa, siku chache baadaye, kampuni imetoa nyaraka ambazo zinafafanua ambapo faida ya utendaji ya kuvutia ambayo inaweka kadi za michoro za mfululizo wa GeForce RTX 30 kutoka kwa watangulizi wake hutoka.

NVIDIA ilielezea kwa nini vichapuzi vya mfululizo wa GeForce RTX 30 vina kiwango kikubwa cha utendaji

Wengi waligundua mara moja kuwa maelezo rasmi ya GeForce RTX 3090, GeForce RTX 3080 na GeForce RTX 3070 kwenye tovuti ya NVIDIA ilionyesha idadi kubwa ya wasindikaji wa CUDA.

NVIDIA ilielezea kwa nini vichapuzi vya mfululizo wa GeForce RTX 30 vina kiwango kikubwa cha utendaji

Kama ilivyotokea, kuongezeka maradufu kwa utendaji wa FP32 wa wasindikaji wa michezo ya kubahatisha ya Ampere ikilinganishwa na Turing kweli hutokea, na inahusishwa na mabadiliko ya usanifu wa miundo ya msingi ya GPU - wasindikaji wa mkondo (SM).

NVIDIA ilielezea kwa nini vichapuzi vya mfululizo wa GeForce RTX 30 vina kiwango kikubwa cha utendaji

Wakati SMs katika GPU za kizazi cha Turing zilikuwa na njia moja ya kukokotoa ya utendakazi wa sehemu zinazoelea, katika Ampere kila kichakataji mkondo kilipokea njia mbili, ambazo kwa jumla zinaweza kufanya hadi shughuli 128 za FMA kwa kila mzunguko wa saa dhidi ya 64 za Turing. Wakati huo huo, nusu ya vitengo vya utekelezaji wa Ampere vinavyopatikana vina uwezo wa kufanya shughuli zote mbili (INT) na shughuli za 32-bit floating point (FP32), wakati nusu ya pili ya vifaa imekusudiwa kwa shughuli za FP32 pekee. Mbinu hii ilitumika kuokoa bajeti ya transistor, kwa kuzingatia ukweli kwamba mzigo wa michezo ya kubahatisha hutoa kwa kiasi kikubwa zaidi FP32 kuliko shughuli za INT. Walakini, huko Turing hakukuwa na watendaji waliojumuishwa hata.


NVIDIA ilielezea kwa nini vichapuzi vya mfululizo wa GeForce RTX 30 vina kiwango kikubwa cha utendaji

Wakati huo huo, ili kutoa wasindikaji wa mtiririko ulioimarishwa na kiasi kinachohitajika cha data, NVIDIA iliongeza ukubwa wa cache ya L1 katika SM kwa theluthi (kutoka 96 hadi 128 KB), na pia iliongeza mara mbili matokeo yake.

Uboreshaji mwingine muhimu katika Ampere ni kwamba CUDA, RT na Tensor cores sasa zinaweza kukimbia kikamilifu sambamba. Hii inaruhusu injini ya graphics, kwa mfano, kutumia DLSS ili kupima sura moja, na wakati huo huo kuhesabu sura inayofuata kwenye cores za CUDA na RT, kupunguza muda wa kupungua kwa nodes za kazi na kuongeza utendaji wa jumla.

Kwa hili lazima tuongeze kwamba kizazi cha pili cha RT, ambacho kinatekelezwa huko Amrere, kinaweza kuhesabu makutano ya pembetatu na miale mara mbili haraka kama ilivyotokea huko Turing. Na alama mpya za tensor za kizazi cha tatu zimeongeza utendaji wa hisabati mara mbili wakati wa kufanya kazi na matrices machache.

Kuongeza kasi maradufu ambapo Ampere hukokotoa makutano ya pembetatu kunapaswa kuwa na athari kubwa katika utendaji wa vichapuzi vya mfululizo wa GeForce RTX 30 katika michezo inayotumia ufuatiliaji wa miale. Kulingana na NVIDIA, ilikuwa tabia hii ambayo ilifanya kama kizuizi katika usanifu wa Turing, wakati kasi ya mahesabu ya makutano ya mionzi ya parallelepipeds inayofunga haikuleta malalamiko yoyote. Sasa usawa wa utendaji katika ufuatiliaji umeboreshwa, na zaidi ya hayo, katika Ampere, aina zote mbili za shughuli za ray (pamoja na pembetatu na parallelepipeds) zinaweza kufanywa kwa sambamba.

Kwa kuongezea hii, utendakazi mpya umeongezwa kwa alama za RT za Ampere ili kujumuisha nafasi ya pembetatu. Hii inaweza kutumika kutia ukungu kwenye vitu vinavyosonga wakati si pembetatu zote kwenye eneo ziko katika hali isiyobadilika.

Ili kuonyesha haya yote, NVIDIA ilionyesha ulinganisho wa moja kwa moja wa jinsi Turing na Ampere GPUs hushughulikia ufuatiliaji wa miale katika Wolfenstein Youngblood katika azimio la 4K. Kama ifuatavyo kutoka kwa kielelezo kilichowasilishwa, Ampere inafaidika katika kasi ya ujenzi wa fremu zote mbili kwa sababu ya mahesabu ya haraka ya hisabati ya FP32, shukrani kwa msingi wa kizazi cha pili cha RT, na vile vile utendakazi sambamba wa rasilimali nyingi za GPU.

NVIDIA ilielezea kwa nini vichapuzi vya mfululizo wa GeForce RTX 30 vina kiwango kikubwa cha utendaji

Kwa kuongeza, ili kuimarisha yaliyo hapo juu, NVIDIA iliwasilisha matokeo ya ziada ya mtihani kwa GeForce RTX 3090, GeForce RTX 3080 na GeForce RTX 3070. Kulingana na wao, GeForce RTX 3070 ni takriban 60% mbele ya GeForce RTX 2070 katika azimio la 1440p, na picha hii inazingatiwa katika michezo iliyo na usaidizi wa RTX, na kwa uboreshaji wa kitamaduni, haswa katika Borderlands 3.

NVIDIA ilielezea kwa nini vichapuzi vya mfululizo wa GeForce RTX 30 vina kiwango kikubwa cha utendaji

Utendaji wa GeForce RTX 3080 ni mzuri mara mbili kuliko ule wa GeForce RTX 2080 katika azimio la 4K. Kweli, katika kesi hii, katika Borderlands 3 bila msaada wa RTX, faida ya kadi mpya sio mara mbili, lakini takriban asilimia 80.

NVIDIA ilielezea kwa nini vichapuzi vya mfululizo wa GeForce RTX 30 vina kiwango kikubwa cha utendaji

Na kadi ya zamani, GeForce RTX 3090, katika majaribio ya NVIDIA inaonyesha takriban faida ya mara moja na nusu zaidi ya Titan RTX.

NVIDIA ilielezea kwa nini vichapuzi vya mfululizo wa GeForce RTX 30 vina kiwango kikubwa cha utendaji

Kulingana na ripoti kutoka kwa waandishi wa habari wa teknolojia, hakiki kamili za muundo wa marejeleo wa GeForce RTX 3080 zinapaswa kuchapishwa mnamo Septemba 14. Siku tatu baadaye, Septemba 17, itaruhusiwa kuchapisha data ya majaribio ya mifano ya uzalishaji ya GeForce RTX 3080 kutoka kwa washirika wa kampuni. Kwa hivyo, kuna muda mdogo sana wa kusubiri matokeo ya vipimo vya kujitegemea vya wawakilishi wa mfululizo wa GeForce RTX 30 kuonekana kwenye mtandao.

Chanzo:



Chanzo: 3dnews.ru

Kuongeza maoni