NVIDIA DGX A100: platform basis Ampere perdana nawiskeun lima petaflop kinerja

Sistim DGX A100, dumasar kana nu Jen-Hsun Huang anyar dicokot kaluar tina oven, ngawengku dalapan A100 GPUs, genep NVLink 3.0 saklar, salapan controller jaringan Mellanox, dua AMD EPYC Roma-generasi prosesor kalawan 64 cores, 1 TB RAM jeung 15 TB SSDs kalayan rojongan NVMe.

NVIDIA DGX A100: platform basis Ampere perdana nawiskeun lima petaflop kinerja

NVIDIA DGX A100 nyaéta generasi katilu tina sistem komputasi perusahaan, dirancang utamana pikeun ngarengsekeun masalah kecerdasan jieunan. Ayeuna sistem sapertos anu diwangun dina prosesor grafik A100 panganyarna ti kulawarga Ampere, nu ngabalukarkeun kanaékan seukeut dina kinerja maranéhanana, nu geus ngahontal 5 petaflops. Hatur nuhun kana ieu, DGX A100 tiasa ngadamel model AI anu langkung kompleks sareng volume data anu langkung ageung.

Pikeun sistem DGX A100, NVIDIA ngan ukur nunjukkeun jumlah total memori HBM2, anu ngahontal 320 GB. itungan arithmetic basajan ngamungkinkeun urang pikeun nangtukeun yén unggal GPU boga 40 GB memori, jeung gambar tina produk anyar nyieun jelas yén volume ieu disebarkeun diantara genep tumpukan. Rubakpita mémori grafik ogé disebutkeun - 12,4 TB / s pikeun sakabéh sistem DGX A100 dina total.

Nganggap yén sistem DGX-1, dumasar kana dalapan Tesla V100s, ngahasilkeun hiji petaflops dina itungan precision dicampur, sarta DGX A100 diklaim ngalakukeun dina lima petaflops, urang bisa nganggap yén dina itungan husus hiji Ampere GPU lima kali leuwih gancang ti. miheulaan na kalawan arsitéktur Volta. Dina sababaraha kasus, kauntungan janten dua puluh kali lipat.

NVIDIA DGX A100: platform basis Ampere perdana nawiskeun lima petaflop kinerja

Dina total, sistem DGX A8 nyadiakeun kinerja puncak 100 operasi per detik dina operasi integer (INT1016), dina operasi titik floating satengah precision (FP16) - 5 petaflops, dina operasi titik floating precision ganda (FP64) - 156 teraflops. . Salaku tambahan, DGX A32 ngahontal prestasi puncak 100 petaflops dina komputasi tensor TF2,5. Hayu urang ngelingan yen hiji teraflops nyaéta 1012 floating point operasi per detik, hiji petaflops nyaeta 1015 floating operasi titik per detik.

Fitur penting tina akselerator NVIDIA A100 nyaéta kamampuan pikeun ngabagi sumber daya hiji GPU kana tujuh bagéan virtual. Ieu ngamungkinkeun anjeun sacara signifikan ningkatkeun kalenturan konfigurasi dina bagéan awan anu sami. Salaku conto, hiji sistem DGX A100 sareng dalapan GPU fisik tiasa janten 56 GPU virtual. Téknologi Multi-Instance GPU (MIG) ngamungkinkeun anjeun milih bagéan tina ukuran anu béda-béda duanana diantara inti komputasi sareng salaku bagian tina mémori cache sareng mémori HBM2, sareng aranjeunna moal bersaing pikeun rubakpita.

NVIDIA DGX A100: platform basis Ampere perdana nawiskeun lima petaflop kinerja

Perhatos yén dibandingkeun sareng sistem DGX sateuacana, anatomi DGX A100 parantos ngalaman sababaraha parobihan. Jumlah pipa panas dina radiator modul SXM3, dimana prosesor grafik A100 sareng memori HBM2 dipasang, parantos ningkat sacara signifikan dibandingkeun sareng modul Tesla V100 generasi Volta, sanaos tungtungna disumputkeun tina pandangan jalma rata-rata. ku panutup luhur. Wates praktis pikeun desain ieu nyaéta 400 W énergi termal. Ieu ogé dikonfirmasi ku ciri resmi A100 dina versi SXM3, diterbitkeun kiwari.

Gigireun A100 GPUs on motherboard nu genep generasi katilu saklar panganteur NVLink, nu babarengan nyadiakeun bursa data dua arah dina laju 4,8 TB / s. NVIDIA ogé ngurus cooling maranéhanana, ditilik ku radiators full-profil kalayan pipa panas. Unggal GPU dialokasikeun 12 saluran antarmuka NVLink; GPU tatangga tiasa tukeur data dina laju 600 GB/s.

Sistem DGX A100 ogé ngagaduhan salapan pangontrol jaringan HDR Mellanox ConnectX-6, sanggup ngirimkeun inpormasi dina kecepatan dugi ka 200 Gbit/s. Dina total, DGX A100 nyayogikeun transfer data dua arah dina laju 3,6 TB/s. Sistem ieu ogé ngagunakeun téknologi Mellanox proprietary anu ditujukeun pikeun skala éfisién sistem komputasi sareng arsitektur sapertos kitu. Pangrojong PCI Express 4.0 dina tingkat platform ditangtukeun ku prosesor generasi AMD EPYC Roma; Hasilna, antarmuka ieu henteu ngan ukur dianggo ku akselerator grafik A100, tapi ogé ku drive solid-state kalayan protokol NVMe.

NVIDIA DGX A100: platform basis Ampere perdana nawiskeun lima petaflop kinerja

Salian DGX A100, NVIDIA parantos ngamimitian nyayogikeun mitrana sareng papan HGX A100, anu mangrupikeun salah sahiji komponén sistem server anu bakal diproduksi ku produsén sanés. Papan HGX A100 tunggal tiasa nampung opat atanapi dalapan GPU NVIDIA A100. Salaku tambahan, pikeun kaperluan sorangan, NVIDIA parantos ngarakit DGX SuperPOD - gugusan 140 sistem DGX A100, nyayogikeun kinerja dina 700 petaflops kalayan diménsi umum anu cukup sederhana. Pausahaan jangji baris nyadiakeun bantuan metodologis ka mitra wishing ngawangun klaster komputasi sarupa dumasar kana DGX A100. Ku jalan kitu, éta nyandak NVIDIA henteu langkung ti sabulan kanggo ngawangun DGX SuperPOD tinimbang sababaraha bulan atanapi malah taun khas pikeun tugas sapertos kitu.

NVIDIA DGX A100: platform basis Ampere perdana nawiskeun lima petaflop kinerja

Numutkeun kana NVIDIA, pangiriman DGX A100 parantos dimimitian dina harga $ 199 per salinan, mitra perusahaan parantos nyayogikeun sistem ieu dina klaster awanna, ékosistem parantos nyertakeun 000 nagara, kalebet Vietnam sareng UAE. Salaku tambahan, solusi grafik sareng arsitéktur Ampere tiasa diprediksi janten bagian tina sistem superkomputer Perlmutter, anu diciptakeun ku Cray pikeun Departemen Energi AS. Éta bakal kalebet GPU NVIDIA Ampere sareng prosesor sentral generasi AMD EPYC Milan kalayan arsitéktur Zen 26. Titik superkomputer dumasar kana NVIDIA Ampere bakal ngahontal palanggan dina satengah kadua taun, sanaos salinan munggaran parantos dugi ka laboratorium khusus Amérika. departemén.



sumber: 3dnews.ru

Tambahkeun komentar