NVIDIA DGX A100: platform berasaskan Ampere sulung menawarkan lima petaflop prestasi

Sistem DGX A100, berdasarkan Jen-Hsun Huang baru-baru ini mengeluarkannya dari ketuhar, termasuk lapan GPU A100, enam suis NVLink 3.0, sembilan pengawal rangkaian Mellanox, dua pemproses generasi AMD EPYC Rome dengan 64 teras, 1 TB RAM dan 15 TB SSD dengan sokongan NVMe.

NVIDIA DGX A100: platform berasaskan Ampere sulung menawarkan lima petaflop prestasi

NVIDIA DGX A100 ialah generasi ketiga sistem pengkomputeran syarikat, direka terutamanya untuk menyelesaikan masalah kecerdasan buatan. Kini sistem sedemikian dibina pada pemproses grafik A100 terkini daripada keluarga Ampere, yang menyebabkan peningkatan mendadak dalam prestasi mereka, yang telah mencapai 5 petaflops. Terima kasih kepada ini, DGX A100 mampu mengendalikan model AI yang lebih kompleks dan volum data yang lebih besar.

Untuk sistem DGX A100, NVIDIA hanya menunjukkan jumlah memori HBM2, yang mencapai 320 GB. Pengiraan aritmetik mudah membolehkan kami menentukan bahawa setiap GPU mempunyai memori 40 GB, dan imej produk baharu menjelaskan dengan jelas bahawa volum ini diedarkan di antara enam tindanan. Jalur lebar memori grafik juga disebut - 12,4 TB / s untuk keseluruhan sistem DGX A100 secara keseluruhan.

Memandangkan sistem DGX-1, berdasarkan lapan Tesla V100, menghasilkan satu petaflop dalam pengiraan ketepatan campuran, dan DGX A100 didakwa berprestasi pada lima petaflop, kita boleh mengandaikan bahawa dalam pengiraan khusus satu GPU Ampere adalah lima kali lebih cepat daripada pendahulunya dengan seni bina Volta. Dalam sesetengah kes, kelebihannya menjadi dua puluh kali ganda.

NVIDIA DGX A100: platform berasaskan Ampere sulung menawarkan lima petaflop prestasi

Secara keseluruhannya, sistem DGX A8 menyediakan prestasi puncak sebanyak 100 operasi sesaat dalam operasi integer (INT1016), dalam operasi titik terapung separuh ketepatan (FP16) - 5 petaflop, dalam operasi titik terapung berketepatan dua kali (FP64) - 156 teraflop . Selain itu, DGX A32 mencapai prestasi puncak 100 petaflops dalam pengkomputeran tensor TF2,5. Mari kita ingat bahawa satu teraflops ialah 1012 operasi titik terapung sesaat, satu petaflops ialah 1015 operasi titik terapung sesaat.

Ciri penting pemecut NVIDIA A100 ialah keupayaan untuk membahagikan sumber satu GPU kepada tujuh segmen maya. Ini membolehkan anda meningkatkan fleksibiliti konfigurasi dengan ketara dalam segmen awan yang sama. Sebagai contoh, satu sistem DGX A100 dengan lapan GPU fizikal boleh bertindak sebagai 56 GPU maya. Teknologi Multi-Instance GPU (MIG) membolehkan anda memilih segmen dengan saiz yang berbeza di antara teras pengkomputeran dan sebagai sebahagian daripada memori cache dan memori HBM2, dan ia tidak akan bersaing antara satu sama lain untuk lebar jalur.

NVIDIA DGX A100: platform berasaskan Ampere sulung menawarkan lima petaflop prestasi

Perlu diingat bahawa berbanding sistem DGX sebelumnya, anatomi DGX A100 telah mengalami beberapa perubahan. Bilangan paip haba dalam radiator modul SXM3, di mana pemproses grafik A100 dengan memori HBM2 dipasang, telah meningkat dengan ketara berbanding modul Tesla V100 generasi Volta, walaupun hujungnya tersembunyi dari pandangan orang biasa. oleh penutup atas. Had praktikal untuk reka bentuk ini ialah 400 W tenaga haba. Ini juga disahkan oleh ciri rasmi A100 dalam versi SXM3, yang diterbitkan hari ini.

Di sebelah GPU A100 pada papan induk ialah enam suis antara muka NVLink generasi ketiga, yang bersama-sama menyediakan pertukaran data dua hala pada kelajuan 4,8 TB/s. NVIDIA juga mengambil berat tentang penyejukan mereka, berdasarkan radiator profil penuh dengan paip haba. Setiap GPU diperuntukkan 12 saluran antara muka NVLink; GPU jiran boleh bertukar-tukar data pada kelajuan 600 GB/s.

Sistem DGX A100 juga menempatkan sembilan pengawal rangkaian Mellanox ConnectX-6 HDR, yang mampu menghantar maklumat pada kelajuan sehingga 200 Gbit/s. Secara keseluruhan, DGX A100 menyediakan pemindahan data dua hala pada kelajuan 3,6 TB/s. Sistem ini juga menggunakan teknologi Mellanox proprietari yang bertujuan untuk penskalaan sistem pengkomputeran yang cekap dengan seni bina sedemikian. Sokongan PCI Express 4.0 pada tahap platform ditentukan oleh pemproses generasi AMD EPYC Rome; akibatnya, antara muka ini digunakan bukan sahaja oleh pemecut grafik A100, tetapi juga oleh pemacu keadaan pepejal dengan protokol NVMe.

NVIDIA DGX A100: platform berasaskan Ampere sulung menawarkan lima petaflop prestasi

Sebagai tambahan kepada DGX A100, NVIDIA telah mula membekalkan rakan kongsinya dengan papan HGX A100, yang merupakan salah satu komponen sistem pelayan yang akan dihasilkan sendiri oleh pengeluar lain. Papan HGX A100 tunggal boleh memuatkan sama ada empat atau lapan GPU NVIDIA A100. Di samping itu, untuk keperluannya sendiri, NVIDIA telah pun memasang DGX SuperPOD - kumpulan 140 sistem DGX A100, memberikan prestasi pada 700 petaflop dengan dimensi keseluruhan yang agak sederhana. Syarikat itu berjanji untuk menyediakan bantuan metodologi kepada rakan kongsi yang ingin membina kelompok pengkomputeran yang serupa berdasarkan DGX A100. Ngomong-ngomong, NVIDIA mengambil masa tidak lebih sebulan untuk membina DGX SuperPOD dan bukannya beberapa bulan atau bahkan bertahun-tahun biasa untuk tugasan tersebut.

NVIDIA DGX A100: platform berasaskan Ampere sulung menawarkan lima petaflop prestasi

Menurut NVIDIA, penghantaran DGX A100 telah pun bermula pada harga $199 setiap salinan, rakan kongsi syarikat sudah menjadi tuan rumah sistem ini dalam kelompok awan mereka, ekosistem sudah meliputi 000 negara, termasuk Vietnam dan UAE. Di samping itu, penyelesaian grafik dengan seni bina Ampere boleh diramalkan akan menjadi sebahagian daripada sistem superkomputer Perlmutter, yang dicipta oleh Cray untuk Jabatan Tenaga AS. Ia akan terdiri daripada pemproses grafik NVIDIA Ampere bersama pemproses pusat generasi AMD EPYC Milan dengan seni bina Zen 26. Nod superkomputer berdasarkan NVIDIA Ampere akan sampai kepada pelanggan pada separuh kedua tahun ini, walaupun salinan pertama telah pun tiba di makmal khusus jabatan Amerika.



Sumber: 3dnews.ru

Tambah komen