NVIDIA GeForce RTX 30 seriyalı sürətləndiricilərin performansında niyə belə bir sıçrayış olduğunu izah etdi

NVIDIA sentyabrın 1-də yeni nəsil Ampere oyun qrafika kartlarını təqdim etdi, lakin ilkin təqdimatda demək olar ki, texniki detallar yox idi. İndi, bir neçə gün sonra şirkət GeForce RTX 30 seriyalı qrafik kartlarını sələflərindən fərqləndirən təsirli performans üstünlüyünün haradan gəldiyini aydınlaşdıran sənədləri yayımladı.

NVIDIA GeForce RTX 30 seriyalı sürətləndiricilərin performansında niyə belə bir sıçrayış olduğunu izah etdi

Çoxları dərhal fərq etdi ki, NVIDIA saytında GeForce RTX 3090, GeForce RTX 3080 və GeForce RTX 3070-in rəsmi spesifikasiyaları heyrətamiz dərəcədə çox sayda CUDA prosessorunu göstərir.

NVIDIA GeForce RTX 30 seriyalı sürətləndiricilərin performansında niyə belə bir sıçrayış olduğunu izah etdi

Göründüyü kimi, Turing ilə müqayisədə Ampere oyun prosessorlarının FP32 performansının ikiqat artması həqiqətən də baş verir və bu, GPU-nun əsas tikinti bloklarının - axın prosessorlarının (SM) arxitekturasının dəyişməsi ilə bağlıdır.

NVIDIA GeForce RTX 30 seriyalı sürətləndiricilərin performansında niyə belə bir sıçrayış olduğunu izah etdi

Turing nəsli GPU-larındakı SM-lər üzən nöqtə əməliyyatları üçün bir hesablama yoluna malik olsa da, Amperdə hər axın prosessoru Turing üçün 128-ə qarşı bir saat tsiklində cəmi 64 FMA əməliyyatı yerinə yetirə bilən iki yol aldı. Eyni zamanda, mövcud Amper icra bölmələrinin yarısı həm tam (INT) əməliyyatlarını, həm də 32 bitlik üzən nöqtə (FP32) əməliyyatlarını yerinə yetirməyə qadirdir, cihazların ikinci yarısı isə yalnız FP32 əməliyyatları üçün nəzərdə tutulub. Bu yanaşma, oyun yükünün INT əməliyyatlarından əhəmiyyətli dərəcədə daha çox FP32 yaratdığına əsaslanaraq, tranzistor büdcəsinə qənaət etmək üçün istifadə edilmişdir. Bununla belə, Turing-də ümumiyyətlə birləşdirilmiş aktuatorlar yox idi.


NVIDIA GeForce RTX 30 seriyalı sürətləndiricilərin performansında niyə belə bir sıçrayış olduğunu izah etdi

Eyni zamanda, təkmilləşdirilmiş axın prosessorlarını lazımi miqdarda məlumatla təmin etmək üçün NVIDIA SM-də L1 önbelleğinin ölçüsünü üçdə bir (96-dan 128 KB-a qədər) artırdı, həmçinin ötürmə qabiliyyətini iki dəfə artırdı.

Amperdə digər mühüm təkmilləşdirmə CUDA, RT və Tensor nüvələrinin indi tam paralel olaraq işləyə bilməsidir. Bu, məsələn, qrafik mühərrikinə bir kadrı miqyaslaşdırmaq üçün DLSS-dən istifadə etməyə və eyni zamanda CUDA və RT nüvələrində növbəti kadrı hesablamağa imkan verir, funksional qovşaqların dayanma müddətini azaldır və ümumi performansı artırır.

Buna əlavə etməliyik ki, Amrere-də tətbiq olunan ikinci nəsil RT nüvələri üçbucaqların şüalarla kəsişmələrini Turinqdə olduğundan iki dəfə tez hesablaya bilir. Və yeni üçüncü nəsil tenzor nüvələri seyrək matrislərlə işləyərkən riyazi performansı iki dəfə artırdı.

Amperin üçbucaqlı kəsişmələri hesabladığı sürətin ikiqat artırılması şüa izləməni dəstəkləyən oyunlarda GeForce RTX 30 seriyalı sürətləndiricilərin işinə əhəmiyyətli təsir göstərməlidir. NVIDIA-ya görə, Türinq arxitekturasında darboğaz rolunu oynayan bu xüsusiyyət idi, eyni zamanda bir-birinə bağlanan paralelepipedlərin şüalarının kəsişmələrinin hesablamalarının sürəti heç bir şikayət yaratmadı. İndi izləmədə performans balansı optimallaşdırılıb və üstəlik, Amperdə hər iki növ şüa əməliyyatı (üçbucaq və paralelepipedlərlə) paralel olaraq yerinə yetirilə bilər.

Bundan əlavə, üçbucaqların mövqeyini interpolyasiya etmək üçün Ampere-nin RT nüvələrinə yeni funksionallıq əlavə edildi. Bu, səhnədəki bütün üçbucaqlar sabit mövqedə olmadıqda hərəkətdə olan obyektləri tutqunlaşdırmaq üçün istifadə edilə bilər.

Bütün bunları göstərmək üçün NVIDIA Turing və Ampere GPU-larının Wolfenstein Youngblood-da 4K rezolyusiyada şüa izləmə ilə necə məşğul olduqlarının birbaşa müqayisəsini göstərdi. Təqdim olunan təsvirdən göründüyü kimi, Ampere həm ikinci nəsil RT nüvələri, həm də heterojen GPU resurslarının paralel işləməsi sayəsində daha sürətli riyazi FP32 hesablamaları sayəsində çərçivənin qurulması sürətindən nəzərəçarpacaq dərəcədə faydalanır.

NVIDIA GeForce RTX 30 seriyalı sürətləndiricilərin performansında niyə belə bir sıçrayış olduğunu izah etdi

Bundan əlavə, yuxarıda göstərilənləri praktiki olaraq gücləndirmək üçün NVIDIA GeForce RTX 3090, GeForce RTX 3080 və GeForce RTX 3070 üçün əlavə test nəticələri təqdim etdi. Onlara görə, GeForce RTX 3070 GeForce RTX 60-i 2070p həllində təxminən 1440% qabaqlayır, və bu şəkil RTX dəstəyi ilə oyunlarda və ənənəvi rasterləşdirmə ilə, xüsusən Borderlands 3-də müşahidə olunur.

NVIDIA GeForce RTX 30 seriyalı sürətləndiricilərin performansında niyə belə bir sıçrayış olduğunu izah etdi

GeForce RTX 3080-in performansı 2080K qətnamə ilə GeForce RTX 4-dən iki dəfə yaxşıdır. Düzdür, bu halda RTX dəstəyi olmayan Borderlands 3-də yeni kartın üstünlüyü ikiqat deyil, təxminən 80 faizdir.

NVIDIA GeForce RTX 30 seriyalı sürətləndiricilərin performansında niyə belə bir sıçrayış olduğunu izah etdi

Və köhnə kart GeForce RTX 3090, NVIDIA-nın öz testlərində Titan RTX ilə müqayisədə təxminən bir yarım dəfə üstünlük göstərir.

NVIDIA GeForce RTX 30 seriyalı sürətləndiricilərin performansında niyə belə bir sıçrayış olduğunu izah etdi

Texniki jurnalistlərin məlumatına görə, GeForce RTX 3080 arayış dizaynının tam icmalı sentyabrın 14-də dərc edilməlidir. Üç gün sonra, sentyabrın 17-də şirkətin tərəfdaşlarından GeForce RTX 3080 modellərinin istehsalı üçün sınaq məlumatlarını dərc etməyə icazə veriləcək. Beləliklə, GeForce RTX 30 seriyası nümayəndələrinin müstəqil sınaqlarının nəticələrinin internetdə görünməsini gözləməyə çox az vaxt qalıb.

Mənbə:



Mənbə: 3dnews.ru

Добавить комментарий