NVIDIA menjelaskan mengapa akselerator seri GeForce RTX 30 memiliki lompatan kinerja yang begitu besar

NVIDIA memperkenalkan kartu grafis gaming Ampere generasi baru pada tanggal 1 September, tetapi presentasi awal hampir tidak memuat detail teknis. Kini, beberapa hari kemudian, perusahaan tersebut telah merilis dokumentasi yang mengklarifikasi dari mana asal keunggulan kinerja mengesankan yang membedakan kartu grafis seri GeForce RTX 30 dari pendahulunya.

NVIDIA menjelaskan mengapa akselerator seri GeForce RTX 30 memiliki lompatan kinerja yang begitu besar

Banyak yang langsung menyadari bahwa spesifikasi resmi GeForce RTX 3090, GeForce RTX 3080, dan GeForce RTX 3070 di situs web NVIDIA menunjukkan jumlah prosesor CUDA yang sangat besar.

NVIDIA menjelaskan mengapa akselerator seri GeForce RTX 30 memiliki lompatan kinerja yang begitu besar

Ternyata, penggandaan kinerja FP32 prosesor gaming Ampere dibandingkan Turing memang terjadi, dan hal ini terkait dengan perubahan arsitektur blok penyusun dasar GPU - stream processor (SM).

NVIDIA menjelaskan mengapa akselerator seri GeForce RTX 30 memiliki lompatan kinerja yang begitu besar

Meskipun SM di GPU generasi Turing memiliki satu jalur komputasi untuk operasi floating point, di Ampere setiap prosesor aliran menerima dua jalur, yang secara total dapat melakukan hingga 128 operasi FMA per siklus jam dibandingkan 64 untuk Turing. Pada saat yang sama, setengah dari unit eksekusi Ampere yang tersedia mampu melakukan operasi integer (INT) dan operasi floating point 32-bit (FP32), sedangkan paruh kedua perangkat ditujukan khusus untuk operasi FP32. Pendekatan ini digunakan untuk menghemat anggaran transistor, berdasarkan fakta bahwa beban permainan menghasilkan lebih banyak FP32 secara signifikan daripada operasi INT. Namun, di Turing tidak ada aktuator gabungan sama sekali.


NVIDIA menjelaskan mengapa akselerator seri GeForce RTX 30 memiliki lompatan kinerja yang begitu besar

Pada saat yang sama, untuk menyediakan prosesor aliran yang ditingkatkan dengan jumlah data yang diperlukan, NVIDIA meningkatkan ukuran cache L1 di SM sebesar sepertiga (dari 96 menjadi 128 KB), dan juga menggandakan throughputnya.

Peningkatan penting lainnya pada Ampere adalah inti CUDA, RT, dan Tensor kini dapat berjalan sepenuhnya secara paralel. Hal ini memungkinkan mesin grafis, misalnya, menggunakan DLSS untuk menskalakan satu frame, dan pada saat yang sama menghitung frame berikutnya pada inti CUDA dan RT, mengurangi waktu henti node fungsional dan meningkatkan kinerja secara keseluruhan.

Untuk ini kita harus menambahkan bahwa inti RT generasi kedua, yang diterapkan di Amrere, dapat menghitung perpotongan segitiga dengan sinar dua kali lebih cepat dibandingkan yang terjadi di Turing. Dan inti tensor generasi ketiga yang baru memiliki kinerja matematika dua kali lipat saat bekerja dengan matriks renggang.

Menggandakan kecepatan Ampere menghitung perpotongan segitiga akan berdampak signifikan pada kinerja akselerator seri GeForce RTX 30 dalam game yang mendukung ray tracing. Menurut NVIDIA, karakteristik inilah yang menjadi penghambat dalam arsitektur Turing, sedangkan kecepatan perhitungan perpotongan sinar paralelepiped yang membatasi tidak menimbulkan keluhan apa pun. Kini keseimbangan performa dalam penelusuran telah dioptimalkan, dan terlebih lagi, di Ampere, kedua jenis operasi sinar (dengan segitiga dan paralelepiped) dapat dilakukan secara paralel.

Selain itu, fungsionalitas baru telah ditambahkan ke inti RT Ampere untuk menginterpolasi posisi segitiga. Ini dapat digunakan untuk memburamkan objek yang bergerak ketika tidak semua segitiga dalam pemandangan berada pada posisi konstan.

Untuk mengilustrasikan semua ini, NVIDIA menunjukkan perbandingan langsung tentang bagaimana GPU Turing dan Ampere menangani ray tracing di Wolfenstein Youngblood pada resolusi 4K. Sebagai berikut dari ilustrasi yang disajikan, Ampere mendapatkan keuntungan nyata dalam kecepatan konstruksi bingkai baik karena penghitungan matematis FP32 yang lebih cepat, berkat inti RT generasi kedua, serta operasi paralel sumber daya GPU yang heterogen.

NVIDIA menjelaskan mengapa akselerator seri GeForce RTX 30 memiliki lompatan kinerja yang begitu besar

Selain itu, untuk memperkuat hal di atas secara praktis, NVIDIA menghadirkan hasil pengujian tambahan untuk GeForce RTX 3090, GeForce RTX 3080, dan GeForce RTX 3070. Menurut mereka, GeForce RTX 3070 unggul sekitar 60% dibandingkan GeForce RTX 2070 dalam resolusi 1440p, dan gambaran ini diamati dalam game dengan dukungan RTX, dan dengan rasterisasi tradisional, khususnya di Borderlands 3.

NVIDIA menjelaskan mengapa akselerator seri GeForce RTX 30 memiliki lompatan kinerja yang begitu besar

Performa GeForce RTX 3080 dua kali lebih baik dibandingkan GeForce RTX 2080 di resolusi 4K. Benar, dalam hal ini, di Borderlands 3 tanpa dukungan RTX, keunggulan kartu baru ini bukan dua kali lipat, melainkan sekitar 80 persen.

NVIDIA menjelaskan mengapa akselerator seri GeForce RTX 30 memiliki lompatan kinerja yang begitu besar

Dan kartu lama, GeForce RTX 3090, dalam pengujian NVIDIA sendiri menunjukkan keunggulan sekitar satu setengah kali lipat dibandingkan Titan RTX.

NVIDIA menjelaskan mengapa akselerator seri GeForce RTX 30 memiliki lompatan kinerja yang begitu besar

Menurut laporan dari jurnalis teknologi, ulasan lengkap desain referensi GeForce RTX 3080 akan dipublikasikan pada 14 September. Tiga hari kemudian, pada 17 September, data pengujian untuk model produksi GeForce RTX 3080 akan diizinkan untuk dipublikasikan dari mitra perusahaan. Dengan demikian, hanya ada sedikit waktu tersisa untuk menunggu hasil pengujian independen perwakilan seri GeForce RTX 30 muncul di Internet.

Sumber:



Sumber: 3dnews.ru

Tambah komentar