NVIDIA DGX A100: ang debut nga platform nga nakabase sa Ampere nagtanyag lima ka petaflops sa pasundayag

Ang DGX A100 nga sistema, base sa diin Jen-Hsun Huang bag-o lang gikuha kini gikan sa hudno, naglakip sa walo ka A100 GPUs, unom ka NVLink 3.0 switch, siyam ka Mellanox network controllers, duha ka AMD EPYC Rome-generation processors nga adunay 64 cores, 1 TB sa RAM ug 15 TB sa SSDs nga adunay suporta sa NVMe.

NVIDIA DGX A100: ang debut nga platform nga nakabase sa Ampere nagtanyag lima ka petaflops sa pasundayag

Ang NVIDIA DGX A100 mao ang ikatulo nga henerasyon sa mga sistema sa kompyuter sa kompanya, nga gidisenyo alang sa pagsulbad sa mga problema sa artipisyal nga paniktik. Karon ang ingon nga mga sistema gitukod sa labing bag-o nga A100 graphics processors gikan sa pamilyang Ampere, nga hinungdan sa usa ka mahait nga pagtaas sa ilang pasundayag, nga nakaabot sa 5 petaflops. Salamat niini, ang DGX A100 makahimo sa pagdumala sa mas komplikado nga mga modelo sa AI ug mas daghang gidaghanon sa datos.

Alang sa DGX A100 nga sistema, ang NVIDIA nagpakita lamang sa kinatibuk-ang gidaghanon sa HBM2 nga panumduman, nga moabot sa 320 GB. Ang yano nga mga kalkulasyon sa aritmetika nagtugot kanato sa pagtino nga ang matag GPU adunay 40 GB nga panumduman, ug ang mga hulagway sa bag-ong produkto nagpatin-aw nga kini nga gidaghanon giapod-apod sa unom ka stack. Gihisgutan usab ang bandwidth sa memorya sa graphics - 12,4 TB / s alang sa tibuuk nga sistema sa DGX A100 sa kinatibuk-an.

Sa pagkonsiderar nga ang DGX-1 nga sistema, base sa walo ka Tesla V100s, naghimo og usa ka petaflops sa mixed-precision nga mga kalkulasyon, ug ang DGX A100 giangkon nga makahimo sa lima ka petaflops, mahimo natong hunahunaon nga sa piho nga mga kalkulasyon ang usa ka Ampere GPU lima ka pilo nga mas paspas kay sa ang gisundan niini sa arkitektura sa Volta. Sa pipila ka mga kaso, ang bentaha mahimong kaluhaan ka pilo.

NVIDIA DGX A100: ang debut nga platform nga nakabase sa Ampere nagtanyag lima ka petaflops sa pasundayag

Sa kinatibuk-an, ang sistema sa DGX A8 naghatag usa ka peak performance sa 100 nga mga operasyon matag segundo sa integer nga mga operasyon (INT1016), sa tunga nga katukma nga floating point operations (FP16) - 5 petaflops, sa double-precision floating point operations (FP64) - 156 teraflops . Dugang pa, ang DGX A32 nakab-ot ang kinatas-ang pasundayag sa 100 petaflops sa TF2,5 tensor computing. Atong hinumduman nga ang usa ka teraflops kay 1012 ka floating point operations kada segundo, ang usa ka petaflops kay 1015 floating point operations kada segundo.

Usa ka importante nga bahin sa NVIDIA A100 accelerators mao ang abilidad sa pagbahin sa mga kapanguhaan sa usa ka GPU ngadto sa pito ka virtual nga mga bahin. Gitugotan ka niini nga madugangan ang pagka-flexible sa pag-configure sa parehas nga bahin sa panganod. Pananglitan, ang usa ka DGX A100 nga sistema nga adunay walo ka pisikal nga GPUs mahimong molihok isip 56 ka virtual GPU. Ang Multi-Instance GPU (MIG) nga teknolohiya nagtugot kanimo sa pagpili sa mga bahin sa lain-laing mga gidak-on pareho sa computing cores ug isip kabahin sa cache memory ug HBM2 memory, ug sila dili makigkompetensya sa usag usa alang sa bandwidth.

NVIDIA DGX A100: ang debut nga platform nga nakabase sa Ampere nagtanyag lima ka petaflops sa pasundayag

Angay nga matikdan nga kung itandi sa miaging mga sistema sa DGX, ang anatomy sa DGX A100 nakaagi sa pipila ka mga pagbag-o. Ang gidaghanon sa mga heat pipe sa mga radiator sa SXM3 modules, diin ang A100 graphics processors nga adunay HBM2 memory na-install, miuswag pag-ayo kon itandi sa Tesla V100 modules sa Volta nga henerasyon, bisan kung ang ilang mga tumoy gitago gikan sa panglantaw sa kasagaran nga tawo. pinaagi sa ibabaw nga mga hapin. Ang praktikal nga limitasyon alang niini nga disenyo mao ang 400 W sa thermal energy. Gipamatud-an usab kini sa opisyal nga mga kinaiya sa A100 sa SXM3 nga bersyon, nga gipatik karon.

Sunod sa A100 GPUs sa motherboard mao ang unom ka ikatulo nga henerasyon nga NVLink interface switch, nga dungan nga naghatag duha ka paagi nga pagbinayloay sa datos sa gikusgon nga 4,8 TB/s. Ang NVIDIA usab seryoso nga nag-atiman sa ilang pagpabugnaw, sa paghukom sa mga full-profile radiators nga adunay mga heat pipe. Ang matag GPU gigahin og 12 ka channel sa NVLink interface; ang silingang mga GPU mahimong magbayloay og data sa gikusgon nga 600 GB/s.

Ang DGX A100 nga sistema usab adunay siyam ka Mellanox ConnectX-6 HDR network controllers, nga makahimo sa pagpasa sa impormasyon sa gikusgon nga hangtod sa 200 Gbit/s. Sa kinatibuk-an, ang DGX A100 naghatag og two-way data transfer sa gikusgon nga 3,6 TB/s. Gigamit usab sa sistema ang proprietary Mellanox nga mga teknolohiya nga gitumong sa episyente nga pag-scale sa mga sistema sa kompyuter nga adunay ingon nga arkitektura. Ang suporta sa PCI Express 4.0 sa lebel sa plataporma gitino sa mga processor sa henerasyon sa AMD EPYC Rome; isip resulta, kini nga interface gigamit dili lamang sa A100 graphics accelerators, kondili usab sa mga solid-state drive nga adunay NVMe protocol.

NVIDIA DGX A100: ang debut nga platform nga nakabase sa Ampere nagtanyag lima ka petaflops sa pasundayag

Dugang sa DGX A100, ang NVIDIA nagsugod na sa paghatag sa iyang mga kauban sa HGX A100 boards, nga usa sa mga sangkap sa mga sistema sa server nga ang ubang mga tiggama maggama sa ilang kaugalingon. Ang usa ka HGX A100 board mahimong maka-accommodate sa upat o walo ka NVIDIA A100 GPUs. Dugang pa, alang sa kaugalingon nga mga panginahanglanon, ang NVIDIA nagtipon na sa DGX SuperPOD - usa ka kumpol sa 140 DGX A100 nga mga sistema, nga naghatag pasundayag sa 700 petaflops nga adunay medyo kasarangan nga kinatibuk-ang mga sukat. Ang kompanya misaad nga maghatag ug metodolohikal nga tabang sa mga kasosyo nga gusto nga magtukod parehas nga mga cluster sa computing base sa DGX A100. Pinaagi sa dalan, gikuha sa NVIDIA nga dili molapas sa usa ka bulan aron matukod ang DGX SuperPOD imbis nga daghang mga bulan o bisan mga tuig nga kasagaran alang sa ingon nga mga buluhaton.

NVIDIA DGX A100: ang debut nga platform nga nakabase sa Ampere nagtanyag lima ka petaflops sa pasundayag

Sumala sa NVIDIA, ang mga paghatod sa DGX A100 nagsugod na sa presyo nga $199 kada kopya, ang mga kasosyo sa kompanya nag-host na niini nga mga sistema sa ilang mga cloud cluster, ang ekosistema naglangkob na sa 000 ka mga nasud, lakip ang Vietnam ug UAE. Dugang pa, ang mga solusyon sa graphic nga adunay arkitektura nga Ampere mahimong matag-an nga bahin sa Perlmutter supercomputer system, nga gihimo ni Cray alang sa US Department of Energy. Maglakip kini sa NVIDIA Ampere GPUs kauban ang AMD EPYC Milan nga mga generation central processor nga adunay Zen 26 nga arkitektura. Ang mga supercomputer node nga gibase sa NVIDIA Ampere makaabot sa kustomer sa ikaduhang tunga sa tuig, bisan tuod ang unang mga kopya nakaabot na sa espesyal nga laboratoryo sa Amerikano. departamento.



Source: 3dnews.ru

Idugang sa usa ka comment