NVIDIA DGX A100: frumraun Ampere-undirstaða pallur býður upp á fimm petaflops af frammistöðu

DGX A100 kerfið, byggt á því sem Jen-Hsun Huang nýlega tók það úr ofninum, inniheldur átta A100 GPU, sex NVLink 3.0 rofa, níu Mellanox netstýringar, tvo AMD EPYC Rome-kynslóð örgjörva með 64 kjarna, 1 TB af vinnsluminni og 15 TB af SSD diskum með NVMe stuðningi.

NVIDIA DGX A100: frumraun Ampere-undirstaða pallur býður upp á fimm petaflops af frammistöðu

NVIDIA DGX A100 er þriðja kynslóð af tölvukerfum fyrirtækisins, hannað fyrst og fremst til að leysa gervigreindarvandamál. Nú eru slík kerfi byggð á nýjustu A100 grafískum örgjörvum úr Ampere fjölskyldunni, sem veldur mikilli aukningu á afköstum þeirra sem hafa náð 5 petaflops. Þökk sé þessu er DGX A100 fær um að takast á við mun flóknari gervigreind líkön og miklu meira magn af gögnum.

Fyrir DGX A100 kerfið gefur NVIDIA aðeins til kynna heildarmagn HBM2 minnis, sem nær 320 GB. Einfaldir reiknireikningar gera okkur kleift að ákvarða að hver GPU hafi 40 GB af minni og myndir af nýju vörunni gera það ljóst að þetta magn er dreift á sex stafla. Einnig er minnst á bandbreidd grafíkminni - 12,4 TB / s fyrir allt DGX A100 kerfið samtals.

Með hliðsjón af því að DGX-1 kerfið, byggt á átta Tesla V100 vélum, framleiddi einn petaflops í útreikningum með blönduðum nákvæmni, og DGX A100 er fullyrt að það skili fimm petaflops, getum við gert ráð fyrir að í sérstökum útreikningum sé einn Ampere GPU fimm sinnum hraðari en forveri hans með Volta arkitektúr. Í sumum tilfellum verður kosturinn tuttugufaldur.

NVIDIA DGX A100: frumraun Ampere-undirstaða pallur býður upp á fimm petaflops af frammistöðu

Alls veitir DGX A8 kerfið hámarksafköst upp á 100 aðgerðum á sekúndu í heiltöluaðgerðum (INT1016), í hálfnákvæmni flotpunktsaðgerðum (FP16) - 5 petaflops, í tvöfaldri nákvæmni flotpunktsaðgerðum (FP64) - 156 teraflops . Að auki nær DGX A32 hámarksafköstum upp á 100 petaflops í TF2,5 tensortölvu. Við skulum muna að einn teraflops er 1012 flotpunktsaðgerðir á sekúndu, einn petaflops er 1015 flotpunktsaðgerðir á sekúndu.

Mikilvægur eiginleiki NVIDIA A100 hröðunar er hæfileikinn til að skipta auðlindum eins GPU í sjö sýndarhluta. Þetta gerir þér kleift að auka verulega sveigjanleika í stillingum í sama skýjahluta. Til dæmis getur eitt DGX A100 kerfi með átta líkamlegum GPU virkað sem 56 sýndar GPU. Multi-Instance GPU (MIG) tækni gerir þér kleift að velja hluta af mismunandi stærðum bæði meðal tölvukjarna og sem hluta af skyndiminni og HBM2 minni, og þeir munu ekki keppa sín á milli um bandbreidd.

NVIDIA DGX A100: frumraun Ampere-undirstaða pallur býður upp á fimm petaflops af frammistöðu

Þess má geta að miðað við fyrri DGX kerfi hefur líffærafræði DGX A100 tekið nokkrum breytingum. Fjöldi hitapípna í ofnum SXM3 eininganna, sem A100 grafískir örgjörvar með HBM2 minni eru settir á, hefur aukist verulega miðað við Tesla V100 einingarnar af Volta kynslóðinni, þó endar þeirra séu huldir sjónum meðalmannsins. við efri hlífarnar. Hagnýt mörk fyrir þessa hönnun eru 400 W af varmaorku. Þetta er einnig staðfest af opinberum eiginleikum A100 í SXM3 útgáfunni, sem birt var í dag.

Við hliðina á A100 GPU á móðurborðinu eru sex þriðju kynslóðar NVLink tengirofar, sem saman veita tvíhliða gagnaskipti á 4,8 TB/s hraða. NVIDIA sá einnig alvarlega um kælingu þeirra, miðað við ofna með fullri sniði með hitapípum. Hver GPU er úthlutað 12 rásum af NVLink viðmótinu; nálægir GPUs geta skipt gögnum á 600 GB/s hraða.

DGX A100 kerfið hýsir einnig níu Mellanox ConnectX-6 HDR netstýringar, sem geta sent upplýsingar á allt að 200 Gbit/s hraða. Alls veitir DGX A100 tvíhliða gagnaflutning á 3,6 TB/s hraða. Kerfið notar einnig sér Mellanox tækni sem miðar að skilvirkri mælikvarða á tölvukerfum með slíkum arkitektúr. PCI Express 4.0 stuðningur á vettvangsstigi er ákvarðaður af örgjörvum AMD EPYC Rome kynslóðar; þar af leiðandi er þetta viðmót notað ekki aðeins af A100 grafíkhröðlum, heldur einnig af solid-state drifum með NVMe samskiptareglunum.

NVIDIA DGX A100: frumraun Ampere-undirstaða pallur býður upp á fimm petaflops af frammistöðu

Til viðbótar við DGX A100 hefur NVIDIA byrjað að útvega samstarfsaðilum sínum HGX A100 borð, sem eru einn af íhlutum netþjónakerfa sem aðrir framleiðendur munu framleiða á eigin spýtur. Eitt HGX A100 borð getur hýst annað hvort fjóra eða átta NVIDIA A100 GPU. Að auki, fyrir eigin þarfir, hefur NVIDIA þegar sett saman DGX SuperPOD - þyrping af 140 DGX A100 kerfum, sem veitir afköst við 700 petaflops með nokkuð hóflegum heildarstærðum. Fyrirtækið lofaði að veita samstarfsaðilum aðferðafræðilega aðstoð sem vilja byggja svipaða tölvuklasa byggða á DGX A100. Við the vegur, það tók NVIDIA ekki meira en mánuð að smíða DGX SuperPOD í stað nokkurra mánaða eða jafnvel ára sem eru dæmigerð fyrir slík verkefni.

NVIDIA DGX A100: frumraun Ampere-undirstaða pallur býður upp á fimm petaflops af frammistöðu

Samkvæmt NVIDIA eru afhendingar á DGX A100 þegar hafin á verði $199 fyrir hvert eintak, samstarfsaðilar fyrirtækisins eru nú þegar að hýsa þessi kerfi í skýjaklasa sínum, vistkerfið nær nú þegar yfir 000 lönd, þar á meðal Víetnam og UAE. Að auki munu grafíklausnir með Ampere arkitektúr vera hluti af Perlmutter ofurtölvukerfinu, búið til af Cray fyrir bandaríska orkumálaráðuneytið. Hann mun samanstanda af NVIDIA Ampere grafískum örgjörvum ásamt AMD EPYC Milan kynslóð miðgjörva með Zen 26 arkitektúr. Ofurtölvuhnútar byggðir á NVIDIA Ampere munu ná til viðskiptavinarins á seinni hluta ársins, þó fyrstu eintökin séu þegar komin á sérhæfða rannsóknarstofu af amerísku deildinni.



Heimild: 3dnews.ru

Bæta við athugasemd