NVIDIA објасни зошто акцелераторите од серијата GeForce RTX 30 имаат таков скок во перформансите

NVIDIA ја претстави новата генерација на Ampere гејминг графички картички на 1 септември, но првичната презентација не содржеше речиси никакви технички детали. Сега, неколку дена подоцна, компанијата објави документација која појаснува од каде доаѓа импресивната предност во перформансите што ги издвојува графичките картички од серијата GeForce RTX 30 од нивните претходници.

NVIDIA објасни зошто акцелераторите од серијата GeForce RTX 30 имаат таков скок во перформансите

Многумина веднаш забележаа дека официјалните спецификации на GeForce RTX 3090, GeForce RTX 3080 и GeForce RTX 3070 на веб-страницата NVIDIA укажуваат на неверојатно голем број CUDA процесори.

NVIDIA објасни зошто акцелераторите од серијата GeForce RTX 30 имаат таков скок во перформансите

Како што се испоставува, удвојувањето на перформансите на FP32 на Ampere гејмерските процесори во споредба со Туринг навистина се случува, и тоа е поврзано со промена во архитектурата на основните градежни блокови на GPU - stream процесорите (SM).

NVIDIA објасни зошто акцелераторите од серијата GeForce RTX 30 имаат таков скок во перформансите

Додека SM-ите во графичките процесори од генерацијата Тјуринг имаа една пресметковна патека за операции со подвижна запирка, во Ampere, секој процесор за стриминг добиваше две патеки, кои вкупно може да изведуваат до 128 FMA операции по такт наспроти 64 за Туринг. Во исто време, половина од достапните Ampere извршни единици се способни да вршат и операции со цели броеви (INT) и операции со 32-битна подвижна запирка (FP32), додека втората половина од уредите се наменети исклучиво за операции FP32. Овој пристап беше искористен за да се заштеди буџетот на транзисторот, врз основа на фактот дека оптоварувањето на игри генерира значително повеќе FP32 отколку операциите на INT. Меѓутоа, во Тјуринг воопшто немаше комбинирани актуатори.


NVIDIA објасни зошто акцелераторите од серијата GeForce RTX 30 имаат таков скок во перформансите

Во исто време, со цел да обезбеди подобрени процесори за проток со потребната количина на податоци, NVIDIA ја зголеми големината на кешот L1 во SM за една третина (од 96 на 128 KB), а исто така ја удвои неговата пропусност.

Друго важно подобрување во Ampere е тоа што јадрата CUDA, RT и Tensor сега можат да работат целосно паралелно. Ова му овозможува на графичкиот мотор, на пример, да користи DLSS за скалирање на една рамка, а во исто време да ја пресмета следната рамка на јадрата CUDA и RT, намалувајќи го времето на застој на функционалните јазли и зголемувајќи ги вкупните перформанси.

На ова мораме да додадеме дека втората генерација RT јадра, кои се имплементирани во Амрере, можат да пресметаат пресеци на триаголници со зраци двојно побрзо отколку што се случи во Тјуринг. И новата трета генерација тензорски јадра ги удвои математичките перформанси при работа со ретки матрици.

Удвојувањето на брзината со која Ampere ги пресметува пресеците на триаголниците треба да има значително влијание врз перформансите на акцелераторите од серијата GeForce RTX 30 во игрите што поддржуваат следење зраци. Според NVIDIA, токму оваа карактеристика делуваше како тесно грло во архитектурата на Тјуринг, додека брзината на пресметките на пресеците на зраците на граничните паралелепипеди не предизвика никакви поплаки. Сега рамнотежата на перформансите во следењето е оптимизирана, а згора на тоа, во Ампер, двата типа операции со зраци (со триаголници и паралелепипеди) можат да се вршат паралелно.

Дополнително на ова, додадена е нова функционалност на RT јадрата на Ampere за интерполирање на положбата на триаголниците. Ова може да се користи за замаглување на објекти во движење кога не сите триаголници во сцената се во постојана положба.

За да го илустрира сето ова, NVIDIA покажа директна споредба за тоа како графичките процесори Turing и Ampere се справуваат со следењето на зраците во Wolfenstein Youngblood со резолуција 4K. Како што следува од презентираната илустрација, Ampere има забележителни придобивки во брзината на конструкција на рамката и поради побрзите математички пресметки на FP32, благодарение на јадрата RT од втората генерација, како и на паралелната работа на хетерогени GPU ресурси.

NVIDIA објасни зошто акцелераторите од серијата GeForce RTX 30 имаат таков скок во перформансите

Дополнително, за практично да го зајакне горенаведеното, NVIDIA претстави дополнителни резултати од тестот за GeForce RTX 3090, GeForce RTX 3080 и GeForce RTX 3070. Според нив, GeForce RTX 3070 е приближно 60% понапред од GeForce RTX 2070 во резолуцијата и оваа слика е забележана во игри со RTX поддршка и со традиционална растеризација, особено во Borderlands 1440.

NVIDIA објасни зошто акцелераторите од серијата GeForce RTX 30 имаат таков скок во перформансите

Перформансите на GeForce RTX 3080 се двојно подобри од оние на GeForce RTX 2080 со резолуција 4K. Точно, во овој случај, во Borderlands 3 без поддршка за RTX, предноста на новата картичка не е двојно, туку приближно 80 проценти.

NVIDIA објасни зошто акцелераторите од серијата GeForce RTX 30 имаат таков скок во перформансите

И постарата картичка, GeForce RTX 3090, во сопствените тестови на NVIDIA покажува приближно еден и пол пати предност во однос на Titan RTX.

NVIDIA објасни зошто акцелераторите од серијата GeForce RTX 30 имаат таков скок во перформансите

Според извештаите од технолошките новинари, целосните прегледи на референтниот дизајн GeForce RTX 3080 треба да бидат објавени на 14-ти септември. Три дена подоцна, на 17 септември, ќе биде дозволено објавување на податоците од тестот за производство на модели GeForce RTX 3080 од партнерите на компанијата. Така, останува многу малку време да се чекаат резултатите од независните тестови на претставниците на серијата GeForce RTX 30 да се појават на Интернет.

Извор:



Извор: 3dnews.ru

Додадете коментар