Esboniodd NVIDIA pam mae gan gyflymwyr cyfres GeForce RTX 30 gymaint o naid mewn perfformiad

Cyflwynodd NVIDIA y genhedlaeth newydd o gardiau graffeg hapchwarae Ampere ar Fedi 1, ond nid oedd bron unrhyw fanylion technegol yn y cyflwyniad cychwynnol. Nawr, ychydig ddyddiau'n ddiweddarach, mae'r cwmni wedi rhyddhau dogfennaeth sy'n egluro o ble y daw'r fantais perfformiad drawiadol sy'n gosod cardiau graffeg cyfres 30 GeForce RTX ar wahân i'w ragflaenwyr.

Esboniodd NVIDIA pam mae gan gyflymwyr cyfres GeForce RTX 30 gymaint o naid mewn perfformiad

Sylwodd llawer ar unwaith fod manylebau swyddogol y GeForce RTX 3090, GeForce RTX 3080 a GeForce RTX 3070 ar wefan NVIDIA yn nodi nifer syfrdanol o fawr o broseswyr CUDA.

Esboniodd NVIDIA pam mae gan gyflymwyr cyfres GeForce RTX 30 gymaint o naid mewn perfformiad

Fel mae'n digwydd, mae dyblu perfformiad FP32 proseswyr hapchwarae Ampere o'i gymharu â Turing yn wir yn digwydd, ac mae'n gysylltiedig â newid ym mhensaernïaeth blociau adeiladu sylfaenol y GPU - proseswyr ffrwd (SM).

Esboniodd NVIDIA pam mae gan gyflymwyr cyfres GeForce RTX 30 gymaint o naid mewn perfformiad

Er bod gan y SMs yn GPUs cenhedlaeth Turing un llwybr cyfrifiannol ar gyfer gweithrediadau pwynt arnawf, yn Ampere derbyniodd pob prosesydd nant ddau lwybr, a all yn gyfan gwbl berfformio hyd at 128 o weithrediadau FMA fesul cylch cloc yn erbyn 64 ar gyfer Turing. Ar yr un pryd, mae hanner yr unedau gweithredu Ampere sydd ar gael yn gallu cyflawni gweithrediadau cyfanrif (INT) a gweithrediadau pwynt arnawf 32-did (FP32), tra bod ail hanner y dyfeisiau wedi'u bwriadu ar gyfer gweithrediadau FP32 yn unig. Defnyddiwyd y dull hwn i arbed cyllideb y transistor, yn seiliedig ar y ffaith bod y llwyth hapchwarae yn cynhyrchu llawer mwy o FP32 na gweithrediadau INT. Fodd bynnag, yn Turing nid oedd unrhyw actiwadyddion cyfun o gwbl.


Esboniodd NVIDIA pam mae gan gyflymwyr cyfres GeForce RTX 30 gymaint o naid mewn perfformiad

Ar yr un pryd, er mwyn darparu'r swm angenrheidiol o ddata i broseswyr ffrwd gwell, cynyddodd NVIDIA faint y storfa L1 yn SM gan draean (o 96 i 128 KB), a dyblodd ei fewnbwn hefyd.

Gwelliant pwysig arall yn Ampere yw y gall creiddiau CUDA, RT a Tensor redeg yn llawn ochr yn ochr bellach. Mae hyn yn caniatáu i'r injan graffeg, er enghraifft, ddefnyddio DLSS i raddfa un ffrâm, ac ar yr un pryd gyfrifo'r ffrâm nesaf ar greiddiau CUDA a RT, gan leihau amser segur nodau swyddogaethol a chynyddu perfformiad cyffredinol.

At hyn mae'n rhaid i ni ychwanegu y gall creiddiau RT ail genhedlaeth, sy'n cael eu gweithredu yn Amrere, gyfrifo croestoriadau trionglau â phelydrau ddwywaith mor gyflym ag y digwyddodd yn Turing. Ac mae creiddiau tensor newydd y drydedd genhedlaeth wedi dyblu perfformiad mathemategol wrth weithio gyda matricsau prin.

Dylai dyblu'r cyflymder y mae Ampere yn cyfrifo croestoriadau triongl gael effaith sylweddol ar berfformiad cyflymyddion cyfres 30 GeForce RTX mewn gemau sy'n cefnogi olrhain pelydrau. Yn ôl NVIDIA, y nodwedd hon a weithredodd fel tagfa ym mhensaernïaeth Turing, tra nad oedd cyflymder cyfrifiadau croestoriadau pelydrau o bibellau cyfochrog yn codi unrhyw gwynion. Nawr mae'r cydbwysedd perfformiad mewn olrhain wedi'i optimeiddio, ac ar ben hynny, yn Ampere, gellir perfformio'r ddau fath o weithrediadau pelydr (gyda thrionglau a phibellau paralel) yn gyfochrog.

Yn ogystal â hyn, mae swyddogaethau newydd wedi'u hychwanegu at greiddiau RT Ampere i ryngosod lleoliad trionglau. Gellir defnyddio hwn i gymylu gwrthrychau yn symud pan nad yw pob triongl yn yr olygfa mewn safle cyson.

I ddangos hyn i gyd, dangosodd NVIDIA gymhariaeth uniongyrchol o sut mae GPUs Turing ac Ampere yn trin olrhain pelydrau yn Wolfenstein Youngblood ar gydraniad 4K. Fel a ganlyn o'r darlun a gyflwynwyd, mae Ampere yn amlwg yn elwa ar gyflymder adeiladu ffrâm oherwydd cyfrifiadau mathemategol cyflymach FP32, diolch i greiddiau RT ail genhedlaeth, yn ogystal â gweithrediad cyfochrog adnoddau GPU heterogenaidd.

Esboniodd NVIDIA pam mae gan gyflymwyr cyfres GeForce RTX 30 gymaint o naid mewn perfformiad

Yn ogystal, er mwyn atgyfnerthu'r uchod yn ymarferol, cyflwynodd NVIDIA ganlyniadau profion ychwanegol ar gyfer y GeForce RTX 3090, GeForce RTX 3080 a GeForce RTX 3070. Yn ôl iddynt, mae'r GeForce RTX 3070 tua 60% o flaen y GeForce RTX 2070 mewn cydraniad 1440p, a gwelir y darlun hwn mewn gemau gyda chefnogaeth RTX, a gyda rasterization traddodiadol, yn enwedig yn Borderlands 3.

Esboniodd NVIDIA pam mae gan gyflymwyr cyfres GeForce RTX 30 gymaint o naid mewn perfformiad

Mae perfformiad y GeForce RTX 3080 ddwywaith cystal â pherfformiad GeForce RTX 2080 ar gydraniad 4K. Yn wir, yn yr achos hwn, yn Borderlands 3 heb gefnogaeth RTX, nid yw mantais y cerdyn newydd yn ddwbl, ond tua 80 y cant.

Esboniodd NVIDIA pam mae gan gyflymwyr cyfres GeForce RTX 30 gymaint o naid mewn perfformiad

Ac mae'r cerdyn hŷn, GeForce RTX 3090, ym mhrofion NVIDIA ei hun yn dangos mantais unwaith a hanner dros y Titan RTX.

Esboniodd NVIDIA pam mae gan gyflymwyr cyfres GeForce RTX 30 gymaint o naid mewn perfformiad

Yn ôl adroddiadau gan newyddiadurwyr technoleg, mae adolygiadau llawn o ddyluniad cyfeirio GeForce RTX 3080 i'w cyhoeddi ar Fedi 14. Dri diwrnod yn ddiweddarach, ar Fedi 17, caniateir i gyhoeddi data prawf ar gyfer cynhyrchu modelau GeForce RTX 3080 gan bartneriaid y cwmni. Felly, ychydig iawn o amser sydd ar ôl i aros am ganlyniadau profion annibynnol o gynrychiolwyr cyfres GeForce RTX 30 i ymddangos ar y Rhyngrwyd.

Ffynhonnell:



Ffynhonnell: 3dnewyddion.ru

Ychwanegu sylw