🥇NVIDIA DGX A100: debutta piattaforma basata in Ampere offre cinque petaflops di prestazioni

U sistema DGX A100, basatu annantu à quale Jen-Hsun Huang recentemente l'hà pigliatu da u fornu, include ottu GPU A100, sei switch NVLink 3.0, nove controller di rete Mellanox, dui processori di generazione AMD EPYC Roma cù core 64, 1 TB di RAM è 15 TB di SSD cù supportu NVMe.

NVIDIA DGX A100 hè a terza generazione di sistemi informatici di a cumpagnia, pensati principalmente per risolve i prublemi di intelligenza artificiale. Avà tali sistemi sò custruiti nantu à l'ultimi processori grafichi A100 da a famiglia Ampere, chì provoca un forte aumentu di u so rendimentu, chì hà righjuntu 5 petaflops. Grazie à questu, u DGX A100 hè capaci di gestisce mudelli AI assai più cumplessi è volumi di dati assai più grande.

Per u sistema DGX A100, NVIDIA indica solu a quantità totale di memoria HBM2, chì righjunghji 320 GB. I calculi aritmetici simplici permettenu di determinà chì ogni GPU hà 40 GB di memoria, è l'imaghjini di u novu pruduttu facenu chjaru chì stu voluminu hè distribuitu trà sei stacks. A larghezza di banda di memoria grafica hè ancu menzionata - 12,4 TB / s per tuttu u sistema DGX A100 in totale.

Cunsiderendu chì u sistema DGX-1, basatu annantu à ottu Tesla V100s, hà pruduttu un petaflops in calculi di precisione mista, è chì u DGX A100 hè dichjaratu chì eseguisce à cinque petaflops, pudemu suppone chì in calculi specifichi un Ampere GPU hè cinque volte più veloce cà. u so predecessore cù l'architettura Volta. In certi casi, u vantaghju diventa vinti volte.

In totale, u sistema DGX A8 furnisce un rendimentu di punta di 100 operazioni per seconda in operazioni integer (INT1016), in operazioni in virgola flottante di mezza precisione (FP16) - 5 petaflops, in operazioni in virgola flottante di doppia precisione (FP64) - 156 teraflops . Inoltre, u DGX A32 ottene un rendimentu di punta di 100 petaflops in l'informatica tensor TF2,5. Ricurdemu chì un teraflops hè 1012 operazioni in virgola flottante per seconda, un petaflops hè 1015 operazioni in virgola flottante per seconda.

Una caratteristica impurtante di l'acceleratori NVIDIA A100 hè a capacità di dividisce e risorse di una GPU in sette segmenti virtuali. Questu permette di aumentà significativamente a flessibilità di cunfigurazione in u stessu segmentu di nuvola. Per esempiu, un sistema DGX A100 cù ottu GPU fisiche pò esse cum'è 56 GPU virtuali. A tecnulugia GPU Multi-Instance (MIG) permette di selezziunà segmenti di diverse dimensioni sia trà i nuclei di l'informatica sia cum'è parte di a memoria cache è a memoria HBM2, è ùn cumpetenu micca l'un l'altru per a larghezza di banda.

Hè da nutà chì paragunatu à i sistemi DGX precedenti, l'anatomia di u DGX A100 hà subitu qualchi cambiamenti. U numaru di tubi di calore in i radiatori di i moduli SXM3, nantu à quale sò installati i processori grafichi A100 cù memoria HBM2, hè aumentatu significativamente cumparatu cù i moduli Tesla V100 di a generazione Volta, anche se i so fini sò oculati da a vista di a persona media. da i coperchi superiori. U limitu praticu per stu disignu hè 400 W di energia termale. Questu hè ancu cunfirmatu da e caratteristiche ufficiali di l'A100 in a versione SXM3, publicata oghje.

Accantu à i GPU A100 nantu à a scheda madre sò sei interruttori di l'interfaccia NVLink di terza generazione, chì inseme furnisce un scambiu di dati bidirezionale à una velocità di 4,8 TB / s. NVIDIA hà ancu cura seriamente di u so rinfrescante, à ghjudicà da i radiatori di prufilu pienu cù tubi di calore. Ogni GPU hè attribuita 12 canali di l'interfaccia NVLink GPU vicini ponu scambià dati à una velocità di 600 GB / s.

U sistema DGX A100 ospita ancu novi cuntrolli di rete Mellanox ConnectX-6 HDR, capaci di trasmette infurmazioni à velocità di finu à 200 Gbit/s. In totale, u DGX A100 furnisce trasferimentu di dati bidirezionale à una velocità di 3,6 TB/s. U sistema usa ancu tecnulugii proprietarii Mellanox destinati à una scala efficaci di i sistemi informatici cù una tale architettura. U supportu di PCI Express 4.0 à u livellu di a piattaforma hè determinatu da i prucessori di generazione AMD EPYC Roma in u risultatu, sta interfaccia hè utilizata micca solu da l'acceleratori di gràficu A100, ma ancu da unità di stati solidi cù u protocolu NVMe.

In più di u DGX A100, NVIDIA hà cuminciatu à furnisce i so partenarii cù schede HGX A100, chì sò unu di i cumpunenti di i sistemi di servitori chì l'altri fabricatori pruducianu per sè stessu. Una sola scheda HGX A100 pò accoglie o quattru o ottu GPU NVIDIA A100. Inoltre, per i so bisogni, NVIDIA hà digià assemblatu DGX SuperPOD - un cluster di 140 sistemi DGX A100, chì furnisce prestazioni à 700 petaflops cù dimensioni in generale abbastanza modeste. A cumpagnia hà prumessu di furnisce assistenza metodulugia à i partenarii chì vulianu custruisce clusters di computer simili basati nantu à u DGX A100. Per via, NVIDIA hà pigliatu micca più di un mesi per custruisce u DGX SuperPOD invece di parechji mesi o ancu anni tipici per tali compiti.

Sicondu NVIDIA, e spedizioni di u DGX A100 sò digià cuminciati à un prezzu di $ 199 per copia, i partenarii di a cumpagnia sò digià ospitu questi sistemi in i so clusters di nuvola, l'ecosistema copre digià 000 paesi, cumpresi Vietnam è UAE. Inoltre, e soluzioni grafiche cù l'architettura Ampere seranu abbastanza previsiblemente parte di u sistema di supercomputer Perlmutter, creatu da Cray per u Dipartimentu di l'Energia di i Stati Uniti. Includerà GPU NVIDIA Ampere à fiancu à i prucessori cintrali di generazione AMD EPYC Milan cù l'architettura Zen 26 Supercomputer nodes basati in NVIDIA Ampere ghjunghjeranu à u cliente in a seconda mità di l'annu, ancu s'è i primi copie sò digià ghjunti à u laboratoriu specializatu di l'American. dipartimentu.

Source: 3dnews.ru

NVIDIA DGX A100: debutta piattaforma basata in Ampere offre cinque petaflops di prestazioni

ProHoster