NVIDIA DGX A100: Ampere-n oinarritutako lehen plataformak bost errendimendu petaflops eskaintzen ditu

DGX A100 sistema, bertan oinarrituta Jen-Hsun Huang duela gutxi atera zuen labetik, zortzi A100 GPU, sei NVLink 3.0 etengailu, bederatzi Mellanox sare-kontrolagailu, 64 nukleoko AMD EPYC Erroma belaunaldiko bi prozesadore, 1 TB RAM eta 15 TB SSD NVMe euskarria dute.

NVIDIA DGX A100: Ampere-n oinarritutako lehen plataformak bost errendimendu petaflops eskaintzen ditu

NVIDIA DGX A100 konpainiaren sistema informatikoen hirugarren belaunaldia da, batez ere adimen artifizialaren arazoak konpontzeko diseinatua. Orain, horrelako sistemak Ampere familiako A100 azken prozesadore grafikoetan eraikita daude, eta horrek errendimenduaren igoera handia eragiten du, 5 petaflops-era iritsi dena. Horri esker, DGX A100 AI eredu askoz konplexuagoak eta datu-bolumen askoz handiagoak kudeatzeko gai da.

DGX A100 sistemarako, NVIDIAk HBM2 memoria-kopuru osoa bakarrik adierazten du, hau da, 320 GB-ra iristen dena. Kalkulu aritmetiko sinpleek GPU bakoitzak 40 GB-ko memoria duela zehazten digu, eta produktu berriaren irudiek argi uzten dute bolumen hori sei pilaren artean banatuta dagoela. Memoria grafikoaren banda zabalera ere aipatzen da - 12,4 TB / s DGX A100 sistema osorako guztira.

Kontuan izanda DGX-1 sistemak, zortzi Tesla V100etan oinarrituta, petaflop bat ekoitzi zuela doitasun mistoko kalkuluetan, eta DGX A100-ak bost petaflop-tan funtzionatzen duela, pentsa dezakegu kalkulu zehatzetan Ampere GPU bat baino bost aldiz azkarragoa dela. bere aurrekoa Volta arkitekturarekin. Zenbait kasutan, abantaila hogei aldiz bihurtzen da.

NVIDIA DGX A100: Ampere-n oinarritutako lehen plataformak bost errendimendu petaflops eskaintzen ditu

Guztira, DGX A8 sistemak segundoko 100 eragiketen errendimendu gorena ematen du zenbaki osoko eragiketetan (INT1016), doitasun erdiko koma mugikorreko eragiketetan (FP16) - 5 petaflops, doitasun bikoitzeko koma mugikorreko eragiketetan (FP64) - 156 teraflops. . Gainera, DGX A32-k 100 petaflops-eko errendimendu gorena lortzen du TF2,5 tentsoreen konputazioan. Gogora dezagun teraflops bat segundoko 1012 koma mugikorreko eragiketa dela, petaflops bat segundoko 1015 koma mugikorreko eragiketa dela.

NVIDIA A100 azeleragailuen ezaugarri garrantzitsu bat GPU baten baliabideak zazpi segmentu birtualetan banatzeko gaitasuna da. Horrek konfigurazio malgutasuna nabarmen handitzeko aukera ematen du hodei-segmentu berean. Adibidez, zortzi GPU fisiko dituen DGX A100 sistema batek 56 GPU birtual gisa jardun dezake. Instantzia Anitzeko GPU (MIG) teknologiak tamaina ezberdinetako segmentuak hauta ditzakezu, bai konputazio nukleoen artean, bai cache memoriaren eta HBM2 memoriaren parte gisa, eta ez dute elkarren artean lehiatuko banda zabalerako.

NVIDIA DGX A100: Ampere-n oinarritutako lehen plataformak bost errendimendu petaflops eskaintzen ditu

Aipatzekoa da aurreko DGX sistemekin alderatuta, DGX A100-ren anatomiak aldaketa batzuk izan dituela. HBM3 memoria duten A100 prozesadore grafikoak instalatuta dauden SXM2 moduluen erradiadoreetako bero-hodien kopurua nabarmen handitu da Volta belaunaldiko Tesla V100 moduluekin alderatuta, nahiz eta haien muturrak batez besteko pertsonaren ikuspegitik ezkutatuta egon. goiko estalkietatik. Diseinu honen muga praktikoa 400 W-ko energia termikoa da. Hori ere berresten dute gaur argitaratutako SXM100 bertsioko A3-ren ezaugarri ofizialek.

Plakako A100 GPUen ondoan hirugarren belaunaldiko NVLink interfaze etengailu daude, eta elkarrekin bi norabideko datu-trukea eskaintzen dute 4,8 TB/s-ko abiaduran. NVIDIAk ere arreta handiz zaindu zuen haien hoztea, bero-hodiak dituzten profil osoko erradiadoreak ikusita. GPU bakoitzari NVLink interfazearen 12 kanal esleitzen zaizkio; inguruko GPUek 600 GB/s-ko abiaduran trukatu ditzakete datuak.

DGX A100 sistemak ere bederatzi Mellanox ConnectX-6 HDR sare kontrolagailu ditu, informazioa 200 Gbit/s-ko abiaduran transmititzeko gai direnak. Guztira, DGX A100-k bi norabideko datu-transferentzia eskaintzen du 3,6 TB/s-ko abiaduran. Sistemak Mellanox teknologia jabedunak ere erabiltzen ditu, arkitektura hori duten informatika-sistemen eskalatze eraginkorra helburu dutenak. Plataforma mailan PCI Express 4.0 euskarria AMD EPYC Rome belaunaldiko prozesadoreek zehazten dute; ondorioz, interfaze hau A100 azeleragailu grafikoek ez ezik, NVMe protokoloa duten egoera solidoko unitateek ere erabiltzen dute.

NVIDIA DGX A100: Ampere-n oinarritutako lehen plataformak bost errendimendu petaflops eskaintzen ditu

DGX A100az gain, NVIDIA bere bazkideei HGX A100 plakekin hornitzen hasi da, beste fabrikatzaileek beren kabuz ekoiztuko dituzten zerbitzari sistemen osagaietako bat. HGX A100 plaka bakar batek lau edo zortzi NVIDIA A100 GPU har ditzake. Horrez gain, bere beharretarako, NVIDIAk dagoeneko muntatu du DGX SuperPOD - 140 DGX A100 sistemen multzoa, 700 petaflops-eko errendimendua eskaintzen duena dimentsio orokor nahiko apalekin. Konpainiak DGX A100-n oinarritutako antzeko informatika-klusterrak eraiki nahi dituzten bazkideei laguntza metodologikoa emango ziela hitzeman zuen. Bide batez, NVIDIAk hilabete bat baino gehiago behar izan zuen DGX SuperPOD eraikitzeko, zeregin horietarako ohiko hilabete batzuk edo urte batzuk egin beharrean.

NVIDIA DGX A100: Ampere-n oinarritutako lehen plataformak bost errendimendu petaflops eskaintzen ditu

NVIDIAren arabera, DGX A100-ren bidalketak dagoeneko hasi dira kopia bakoitzeko 199 $-ko prezioan, konpainiaren bazkideek sistema hauek hodeiko klusterretan ostatatzen dituzte dagoeneko, ekosistemak 000 herrialde hartzen ditu dagoeneko, Vietnam eta EAE barne. Horrez gain, Ampere arkitektura duten soluzio grafikoak, ziur asko, Cray-k AEBetako Energia Sailerako sortutako Perlmutter superordenagailu sistemaren parte izango dira. NVIDIA Ampere prozesadore grafikoek osatuko dute, Zen 26 arkitektura duten AMD EPYC Milan belaunaldiko prozesadore zentralekin batera. NVIDIA Ampere-n oinarritutako superordenagailu nodoak urteko bigarren seihilekoan iritsiko dira bezeroarengana, nahiz eta lehen kopiak dagoeneko iritsi diren laborategi espezializatura. Amerikako departamendua.



Iturria: 3dnews.ru

Gehitu iruzkin berria