NVIDIA DGX A100: debüüt Ampere-põhine platvorm pakub viis petaflopsi jõudlust

DGX A100 süsteem, mille põhjal Jen-Hsun Huang hiljuti võttis selle ahjust välja, sisaldab kaheksat A100 GPU-d, kuut NVLink 3.0 lülitit, üheksat Mellanoxi võrgukontrollerit, kahte AMD EPYC Rooma põlvkonna protsessorit 64 tuumaga, 1 TB muutmälu ja 15 TB NVMe toega SSD-sid.

NVIDIA DGX A100: debüüt Ampere-põhine platvorm pakub viis petaflopsi jõudlust

NVIDIA DGX A100 on ettevõtte arvutussüsteemide kolmas põlvkond, mis on mõeldud eelkõige tehisintellekti probleemide lahendamiseks. Nüüd on sellised süsteemid üles ehitatud Ampere perekonna uusimatele A100 graafikaprotsessoritele, mis põhjustab nende jõudluse järsu tõusu, mis on jõudnud 5 petaflopini. Tänu sellele on DGX A100 võimeline käsitlema palju keerukamaid AI mudeleid ja palju suuremaid andmemahtusid.

DGX A100 süsteemi puhul näitab NVIDIA ainult HBM2 mälu kogumahtu, mis ulatub 320 GB-ni. Lihtsad aritmeetilised arvutused võimaldavad kindlaks teha, et igal GPU-l on 40 GB mälu ning uue toote kujutised näitavad, et see maht on jaotatud kuue virna vahel. Mainitud on ka graafikamälu ribalaius - 12,4 TB / s kogu DGX A100 süsteemi kohta kokku.

Arvestades, et kaheksal Tesla V1-l põhinev DGX-100 süsteem andis segatäpsusega arvutustes ühe petaflopsi ja DGX A100 töötab väidetavalt viie petaflopiga, võime eeldada, et konkreetsetes arvutustes on üks Ampere GPU viis korda kiirem kui selle eelkäija Volta arhitektuuriga. Mõnel juhul muutub eelis kahekümnekordseks.

NVIDIA DGX A100: debüüt Ampere-põhine platvorm pakub viis petaflopsi jõudlust

Kokku annab DGX A8 süsteem maksimaalse jõudluse 100 toimingut sekundis täisarvulistes operatsioonides (INT1016), poole täpsusega ujukomatehtes (FP16) - 5 petaflopsi, topelttäpsusega ujukomatehtes (FP64) - 156 teraflopsi . Lisaks saavutab DGX A32 TF100 tensorarvutuses maksimaalse jõudluse 2,5 petaflopsi. Meenutagem, et üks teraflops on 1012 ujukomatehet sekundis, üks petaflops on 1015 ujukomatehet sekundis.

NVIDIA A100 kiirendite oluline omadus on võimalus jagada ühe GPU ressursse seitsmeks virtuaalseks segmendiks. See võimaldab oluliselt suurendada konfiguratsiooni paindlikkust samas pilvesegmendis. Näiteks üks DGX A100 süsteem kaheksa füüsilise GPU-ga võib toimida 56 virtuaalse GPU-na. Multi-Instance GPU (MIG) tehnoloogia võimaldab valida erineva suurusega segmente nii arvutustuumade hulgast kui ka vahemälu ja HBM2 mälu osana ning need ei konkureeri üksteisega ribalaiuse osas.

NVIDIA DGX A100: debüüt Ampere-põhine platvorm pakub viis petaflopsi jõudlust

Väärib märkimist, et võrreldes varasemate DGX süsteemidega on DGX A100 anatoomias toimunud mõningaid muudatusi. SXM3 moodulite radiaatorites, millele on paigaldatud HBM100 mäluga A2 graafikaprotsessorid, on soojustorude arv võrreldes Volta põlvkonna Tesla V100 moodulitega oluliselt kasvanud, kuigi nende otsad on tavainimese vaate eest varjatud. ülemiste kaante poolt. Selle konstruktsiooni praktiline piirang on 400 W soojusenergiat. Seda kinnitavad ka täna avaldatud A100 ametlikud omadused SXM3 versioonis.

Emaplaadil asuvate A100 GPU-de kõrval on kuus kolmanda põlvkonna NVLinki liidese lülitit, mis koos tagavad kahesuunalise andmevahetuse kiirusega 4,8 TB/s. NVIDIA hoolitses tõsiselt ka nende jahutuse eest, otsustades täisprofiilsete soojustorudega radiaatorite järgi. Igale GPU-le on eraldatud 12 NVLinki liidese kanalit, naabruses asuvad GPU-d saavad andmeid vahetada kiirusega 600 GB/s.

DGX A100 süsteemis on ka üheksa Mellanox ConnectX-6 HDR võrgukontrollerit, mis on võimelised edastama teavet kiirusega kuni 200 Gbit/s. Kokku tagab DGX A100 kahesuunalist andmeedastust kiirusega 3,6 TB/s. Süsteem kasutab ka patenteeritud Mellanoxi tehnoloogiaid, mille eesmärk on sellise arhitektuuriga arvutisüsteemide tõhus skaleerimine. PCI Express 4.0 toe platvormi tasemel määravad kindlaks AMD EPYC Rome põlvkonna protsessorid; selle tulemusena ei kasuta seda liidest mitte ainult A100 graafikakiirendid, vaid ka NVMe protokolliga pooljuhtdraivid.

NVIDIA DGX A100: debüüt Ampere-põhine platvorm pakub viis petaflopsi jõudlust

Lisaks DGX A100-le on NVIDIA alustanud oma partnerite varustamist HGX A100 plaatidega, mis on serverisüsteemide üks komponente, mida teised tootjad iseseisvalt tootma hakkavad. Üks HGX A100 plaat mahutab kas neli või kaheksa NVIDIA A100 GPU-d. Lisaks on NVIDIA enda vajadusteks juba kokku pannud DGX SuperPOD - 140 DGX A100 süsteemist koosneva klastri, mis pakub jõudlust 700 petaflopsi juures üsna tagasihoidlike üldmõõtmetega. Ettevõte lubas pakkuda metoodilist abi partneritele, kes soovivad DGX A100 baasil ehitada sarnaseid arvutusklastreid. Muide, NVIDIA-l kulus DGX SuperPODi ehitamiseks mitte rohkem kui kuu, mitte rohkem kui kuu või isegi aasta, mis on sellistele ülesannetele omane.

NVIDIA DGX A100: debüüt Ampere-põhine platvorm pakub viis petaflopsi jõudlust

NVIDIA andmetel on DGX A100 tarned juba alanud hinnaga 199 000 dollarit koopia kohta, ettevõtte partnerid majutavad neid süsteeme juba oma pilveklastrites, ökosüsteem hõlmab juba 26 riiki, sealhulgas Vietnami ja AÜE. Lisaks saavad Ampere'i arhitektuuriga graafikalahendused üsna ennustatavalt osaks Perlmutteri superarvutisüsteemist, mille on loonud Cray USA energeetikaministeeriumi jaoks. See hõlmab NVIDIA Ampere GPU-sid koos AMD EPYC Milani põlvkonna keskprotsessoritega Zen 3 arhitektuuriga. NVIDIA Amperel põhinevad superarvuti sõlmed jõuavad kliendini aasta teises pooles, kuigi esimesed koopiad on juba jõudnud Ameerika spetsialiseeritud laborisse osakond.



Allikas: 3dnews.ru

Lisa kommentaar