NVIDIA GeForce RTX 30 seriyali tezlatkichlari nima uchun unumdorlikda bunday sakrashga ega ekanligini tushuntirdi.

NVIDIA 1-sentabr kuni yangi avlod Ampere o‘yin grafik kartalarini taqdim etdi, biroq dastlabki taqdimotda texnik tafsilotlar deyarli yo‘q edi. Endi, bir necha kundan so'ng, kompaniya GeForce RTX 30-seriyali grafik kartalarini o'zidan oldingilaridan ajratib turadigan ta'sirchan ishlash ustunligi qayerdan kelganligini aniqlaydigan hujjatlarni e'lon qildi.

NVIDIA GeForce RTX 30 seriyali tezlatkichlari nima uchun unumdorlikda bunday sakrashga ega ekanligini tushuntirdi.

Ko'pchilik NVIDIA veb-saytidagi GeForce RTX 3090, GeForce RTX 3080 va GeForce RTX 3070 ning rasmiy spetsifikatsiyalari CUDA protsessorlarining hayratlanarli darajada ko'pligini ko'rsatganini darhol payqashdi.

NVIDIA GeForce RTX 30 seriyali tezlatkichlari nima uchun unumdorlikda bunday sakrashga ega ekanligini tushuntirdi.

Ma'lum bo'lishicha, Ampere o'yin protsessorlarining FP32 unumdorligining Turingga nisbatan ikki baravar oshishi haqiqatan ham ro'y beradi va bu GPU ning asosiy qurilish bloklari - oqim protsessorlari (SM) arxitekturasining o'zgarishi bilan bog'liq.

NVIDIA GeForce RTX 30 seriyali tezlatkichlari nima uchun unumdorlikda bunday sakrashga ega ekanligini tushuntirdi.

Turing avlodi GPUlaridagi SM-lar suzuvchi nuqta operatsiyalari uchun bitta hisoblash yo'liga ega bo'lsa-da, Amperda har bir oqim protsessoriga ikkita yo'l bor edi, ular jami bir soat siklida 128 ta FMA operatsiyasini bajarishi mumkin, Turing uchun esa 64 ta. Shu bilan birga, mavjud Amper ijro birliklarining yarmi ham butun (INT) operatsiyalarini, ham 32-bitli suzuvchi nuqta (FP32) operatsiyalarini bajarishga qodir, qurilmalarning ikkinchi yarmi esa faqat FP32 operatsiyalari uchun mo'ljallangan. Ushbu yondashuv tranzistorlar byudjetini tejash uchun ishlatilgan, chunki o'yin yuki INT operatsiyalariga qaraganda sezilarli darajada ko'proq FP32 hosil qiladi. Biroq, Turingda birlashtirilgan aktuatorlar umuman yo'q edi.


NVIDIA GeForce RTX 30 seriyali tezlatkichlari nima uchun unumdorlikda bunday sakrashga ega ekanligini tushuntirdi.

Shu bilan birga, takomillashtirilgan oqim protsessorlarini kerakli miqdordagi ma'lumotlar bilan ta'minlash uchun NVIDIA SM-dagi L1 kesh hajmini uchdan biriga (96 dan 128 KBgacha) oshirdi va o'tkazish qobiliyatini ikki baravar oshirdi.

Amperning yana bir muhim yaxshilanishi shundaki, CUDA, RT va Tensor yadrolari endi to'liq parallel ravishda ishlashi mumkin. Bu grafik dvigatelga, masalan, bitta kadrni masshtablash uchun DLSS-dan foydalanish va shu bilan birga CUDA va RT yadrolarida keyingi kadrni hisoblash imkonini beradi, funktsional tugunlarning ishlamay qolish vaqtini kamaytiradi va umumiy ish faoliyatini oshiradi.

Bunga shuni qo'shimcha qilishimiz kerakki, Amrereda amalga oshirilgan ikkinchi avlod RT yadrolari uchburchaklarning nurlar bilan kesishishlarini Turingda bo'lgani kabi ikki baravar tez hisoblay oladi. Va yangi uchinchi avlod tenzor yadrolari siyrak matritsalar bilan ishlashda matematik ko'rsatkichlarni ikki baravar oshirdi.

Amper uchburchak kesishmalarini hisoblash tezligini ikki baravar oshirish, nurlarni kuzatishni qo'llab-quvvatlaydigan o'yinlarda GeForce RTX 30-seriyali tezlatgichlarning ishlashiga sezilarli ta'sir ko'rsatishi kerak. NVIDIA ma'lumotlariga ko'ra, aynan shu xususiyat Tyuring arxitekturasida to'siq bo'lib xizmat qilgan, shu bilan birga chegaradosh parallelepipedlar nurlarining kesishishlarini hisoblash tezligi hech qanday shikoyat qilmadi. Endi kuzatuvda ishlash balansi optimallashtirildi va bundan tashqari, Amperda ikkala turdagi nur operatsiyalari (uchburchaklar va parallelepipedlar bilan) parallel ravishda bajarilishi mumkin.

Bunga qo'shimcha ravishda, uchburchaklar o'rnini interpolyatsiya qilish uchun Ampere RT yadrolariga yangi funksionallik qo'shildi. Bu sahnadagi barcha uchburchaklar doimiy holatda bo'lmaganda, harakatdagi narsalarni xiralashtirish uchun ishlatilishi mumkin.

Bularning barchasini ko'rsatish uchun NVIDIA Turing va Ampere GPUlari 4K piksellar sonida Wolfenstein Youngblood-da nurlarni kuzatishni qanday boshqarishini to'g'ridan-to'g'ri taqqoslashni ko'rsatdi. Taqdim etilgan rasmdan ko'rinib turibdiki, Ampere ikkinchi avlod RT yadrolari, shuningdek, heterojen GPU resurslarining parallel ishlashi tufayli FP32 tezroq matematik hisob-kitoblari tufayli ramka qurish tezligida sezilarli foyda keltiradi.

NVIDIA GeForce RTX 30 seriyali tezlatkichlari nima uchun unumdorlikda bunday sakrashga ega ekanligini tushuntirdi.

Bundan tashqari, yuqorida aytilganlarni amalda mustahkamlash uchun NVIDIA GeForce RTX 3090, GeForce RTX 3080 va GeForce RTX 3070 uchun qoʻshimcha test natijalarini taqdim etdi. Ularga koʻra, GeForce RTX 3070 GeForce RTX 60-dan 2070p rezolyutsiyada taxminan 1440% oldinda. va bu rasm RTX qo'llab-quvvatlanadigan o'yinlarda va an'anaviy rasterizatsiya bilan, xususan, Borderlands 3 da kuzatiladi.

NVIDIA GeForce RTX 30 seriyali tezlatkichlari nima uchun unumdorlikda bunday sakrashga ega ekanligini tushuntirdi.

GeForce RTX 3080 ning ishlashi 2080K piksellar sonida GeForce RTX 4 dan ikki baravar yaxshi. To'g'ri, bu holda, Borderlands 3-da RTX-ni qo'llab-quvvatlamasdan, yangi kartaning afzalligi ikki barobar emas, balki taxminan 80 foizni tashkil qiladi.

NVIDIA GeForce RTX 30 seriyali tezlatkichlari nima uchun unumdorlikda bunday sakrashga ega ekanligini tushuntirdi.

Va eski GeForce RTX 3090 kartasi NVIDIA-ning o'z sinovlarida Titan RTX-dan taxminan bir yarim baravar ustunlikni ko'rsatadi.

NVIDIA GeForce RTX 30 seriyali tezlatkichlari nima uchun unumdorlikda bunday sakrashga ega ekanligini tushuntirdi.

Texnik jurnalistlarning xabarlariga ko'ra, GeForce RTX 3080 mos yozuvlar dizaynining to'liq sharhlari 14 sentyabrda e'lon qilinishi kerak. Uch kundan so‘ng, 17-sentabrda kompaniya hamkorlarining GeForce RTX 3080 modellarini ishlab chiqarish bo‘yicha sinov ma’lumotlarini chop etishga ruxsat beriladi. Shunday qilib, GeForce RTX 30 seriyasi vakillarining mustaqil sinovlari natijalari Internetda paydo bo'lishini kutish uchun juda oz vaqt qoldi.

Manba:



Manba: 3dnews.ru

a Izoh qo'shish