NVIDIA DGX A100: platform basis Ampere debut nawakake limang petaflop kinerja

Sistem DGX A100, adhedhasar Jen-Hsun Huang bubar njupuk metu saka open, kalebu wolung GPU A100, enem ngalih NVLink 3.0, sangang pengontrol jaringan Mellanox, loro prosesor generasi AMD EPYC Roma kanthi 64 intine, 1 TB RAM lan 15 TB SSD kanthi dhukungan NVMe.

NVIDIA DGX A100: platform basis Ampere debut nawakake limang petaflop kinerja

NVIDIA DGX A100 minangka generasi katelu sistem komputasi perusahaan, dirancang utamane kanggo ngrampungake masalah intelijen buatan. Saiki sistem kasebut dibangun ing pemroses grafis A100 paling anyar saka kulawarga Ampere, sing nyebabake peningkatan kinerja, sing wis tekan 5 petaflops. Thanks kanggo iki, DGX A100 bisa nangani model AI sing luwih rumit lan volume data sing luwih gedhe.

Kanggo sistem DGX A100, NVIDIA mung nuduhake jumlah total memori HBM2, sing tekan 320 GB. petungan aritmetika prasaja ngidini kita nemtokake sing saben GPU wis 40 memori GB, lan gambar saka produk anyar nggawe cetha yen volume iki mbagekke antarane enem tumpukan. Bandwidth memori grafis uga kasebut - 12,4 TB / s kanggo kabeh sistem DGX A100 ing total.

Ngelingi yen sistem DGX-1, adhedhasar wolung Tesla V100s, ngasilake siji petaflop ing petungan presisi campuran, lan DGX A100 diklaim bisa nindakake ing limang petaflops, kita bisa nganggep yen ing pitungan tartamtu, siji Ampere GPU kaping lima luwih cepet tinimbang sawijining leluhur karo arsitektur Volta. Ing sawetara kasus, kauntungan dadi rong puluh.

NVIDIA DGX A100: platform basis Ampere debut nawakake limang petaflop kinerja

Secara total, sistem DGX A8 nyedhiyakake kinerja puncak 100 operasi per detik ing operasi integer (INT1016), ing operasi titik ngambang setengah presisi (FP16) - 5 petaflop, ing operasi titik ngambang presisi kaping pindho (FP64) - 156 teraflop . Kajaba iku, DGX A32 entuk kinerja puncak 100 petaflops ing komputasi tensor TF2,5. Elinga yen siji teraflop yaiku 1012 operasi floating point per detik, siji petaflop yaiku 1015 operasi floating point per detik.

Fitur penting akselerator NVIDIA A100 yaiku kemampuan kanggo mbagi sumber daya siji GPU dadi pitung segmen virtual. Iki ngidini sampeyan nambah fleksibilitas konfigurasi kanthi signifikan ing bagean awan sing padha. Contone, siji sistem DGX A100 kanthi wolung GPU fisik bisa dadi 56 GPU virtual. Teknologi Multi-Instance GPU (MIG) ngidini sampeyan milih segmen kanthi ukuran sing beda-beda ing antarane inti komputasi lan minangka bagean saka memori cache lan memori HBM2, lan ora bakal saingan karo bandwidth.

NVIDIA DGX A100: platform basis Ampere debut nawakake limang petaflop kinerja

Wigati dicathet yen dibandhingake karo sistem DGX sadurunge, anatomi DGX A100 wis ngalami owah-owahan. Jumlah pipa panas ing radiator modul SXM3, ing ngendi prosesor grafis A100 karo memori HBM2 dipasang, saya tambah akeh dibandhingake karo modul Tesla V100 saka generasi Volta, sanajan ujunge didhelikake saka tampilan wong rata-rata. dening tutup ndhuwur. Watesan praktis kanggo desain iki yaiku 400 W energi termal. Iki uga dikonfirmasi dening karakteristik resmi A100 ing versi SXM3, diterbitake dina.

Ing jejere GPU A100 ing motherboard ana enem ngalih antarmuka NVLink generasi katelu, sing bebarengan nyedhiyakake pertukaran data rong arah kanthi kecepatan 4,8 TB / s. NVIDIA uga ngati-ati kanthi serius babagan pendinginan, miturut radiator profil lengkap kanthi pipa panas. Saben GPU diwenehake 12 saluran antarmuka NVLink; GPU tetanggan bisa ngganti data kanthi kecepatan 600 GB/s.

Sistem DGX A100 uga duwe sangang pengontrol jaringan HDR Mellanox ConnectX-6, sing bisa ngirim informasi kanthi kecepatan nganti 200 Gbit/s. Secara total, DGX A100 nyedhiyakake transfer data rong arah kanthi kecepatan 3,6 TB/s. Sistem iki uga nggunakake teknologi Mellanox proprietary sing ngarahake skala efisien sistem komputasi kanthi arsitektur kasebut. Dhukungan PCI Express 4.0 ing tingkat platform ditemtokake dening pemroses generasi AMD EPYC Roma; minangka asil, antarmuka iki digunakake ora mung dening akselerator grafis A100, nanging uga dening drive solid-state kanthi protokol NVMe.

NVIDIA DGX A100: platform basis Ampere debut nawakake limang petaflop kinerja

Saliyane DGX A100, NVIDIA wis wiwit nyedhiyakake mitra karo papan HGX A100, sing minangka salah sawijining komponen sistem server sing bakal diprodhuksi dening pabrikan liyane. Papan siji HGX A100 bisa nampung papat utawa wolung GPU NVIDIA A100. Kajaba iku, kanggo kabutuhan dhewe, NVIDIA wis nglumpukake DGX SuperPOD - klompok 140 sistem DGX A100, nyedhiyakake kinerja ing 700 petaflops kanthi dimensi sakabèhé sing cukup andhap asor. Perusahaan kasebut janji bakal menehi pitulung metodologis kanggo mitra sing pengin mbangun kluster komputasi sing padha adhedhasar DGX A100. Miturut cara, NVIDIA butuh ora luwih saka sasi kanggo mbangun DGX SuperPOD tinimbang sawetara sasi utawa malah taun khas kanggo tugas kasebut.

NVIDIA DGX A100: platform basis Ampere debut nawakake limang petaflop kinerja

Miturut NVIDIA, pangiriman DGX A100 wis diwiwiti kanthi rega $ 199 saben salinan, mitra perusahaan wis nyelenggarakake sistem kasebut ing kluster awan, ekosistem kasebut wis nyakup 000 negara, kalebu Vietnam lan UAE. Kajaba iku, solusi grafis kanthi arsitektur Ampere bisa diprediksi minangka bagean saka sistem superkomputer Perlmutter, digawe dening Cray kanggo Departemen Energi AS. Iki bakal kalebu prosesor grafis NVIDIA Ampere bebarengan karo prosesor tengah generasi AMD EPYC Milan kanthi arsitektur Zen 26. Node superkomputer adhedhasar NVIDIA Ampere bakal tekan pelanggan ing paruh kapindho taun, sanajan salinan pisanan wis teka ing laboratorium khusus. departemen Amérika.



Source: 3dnews.ru

Add a comment