NVIDIA DGX A100: debút Ampere-basearre platfoarm biedt fiif petaflops fan prestaasjes

De DGX A100 systeem, basearre op hokker Jen-Hsun Huang koartlyn naam it út 'e oven, omfettet acht A100 GPU's, seis NVLink 3.0-switches, njoggen Mellanox-netwurkcontrollers, twa AMD EPYC Rome-generaasje processors mei 64 kearnen, 1 TB fan RAM en 15 TB fan SSD's mei NVMe-stipe.

NVIDIA DGX A100: debút Ampere-basearre platfoarm biedt fiif petaflops fan prestaasjes

NVIDIA DGX A100 is de tredde generaasje fan 'e kompjûtersystemen fan it bedriuw, primêr ûntworpen foar it oplossen fan problemen mei keunstmjittige yntelliginsje. No binne sokke systemen boud op 'e lêste A100 grafyske processors fan' e Ampere-famylje, wat in skerpe ferheging fan har prestaasjes feroarsaket, dy't 5 petaflops hat berikt. Hjirmei is de DGX A100 yn steat om folle kompleksere AI-modellen en folle gruttere gegevensvoluminten te behanneljen.

Foar it DGX A100-systeem jout NVIDIA allinich it totale bedrach fan HBM2-ûnthâld oan, dat 320 GB berikt. Ienfâldige arithmetic berekkeningen kinne ús bepale dat eltse GPU hat 40 GB ûnthâld, en bylden fan it nije produkt meitsje it dúdlik dat dit folume wurdt ferdield ûnder seis stacks. De bânbreedte fan it grafysk ûnthâld wurdt ek neamd - 12,4 TB / s foar it heule DGX A100-systeem yn totaal.

Yn betinken nommen dat it DGX-1-systeem, basearre op acht Tesla V100's, ien petaflops produsearre yn berekkeningen mei mingde-precision, en de DGX A100 wurdt beweare te prestearjen op fiif petaflops, kinne wy ​​​​oannimme dat yn spesifike berekkeningen ien Ampere GPU fiif kear flugger is as syn foargonger mei Volta-arsjitektuer. Yn guon gefallen wurdt it foardiel tweintichfâldich.

NVIDIA DGX A100: debút Ampere-basearre platfoarm biedt fiif petaflops fan prestaasjes

Yn totaal leveret it DGX A8-systeem in peakprestaasje fan 100 operaasjes per sekonde yn integer operaasjes (INT1016), yn heal-precision driuwende punt operaasjes (FP16) - 5 petaflops, yn dûbele-precision driuwende punt operaasjes (FP64) - 156 teraflops . Derneist berikt de DGX A32 in peakprestaasje fan 100 petaflops yn TF2,5 tensor-komputer. Lit ús ûnthâlde dat ien teraflops 1012 driuwende punt operaasjes per sekonde, ien petaflops is 1015 driuwende punt operaasjes per sekonde.

In wichtich skaaimerk fan NVIDIA A100-accelerators is de mooglikheid om de boarnen fan ien GPU te ferdielen yn sân firtuele segminten. Hjirmei kinne jo konfiguraasjefleksibiliteit signifikant ferheegje yn itselde wolksegment. Bygelyks, ien DGX A100-systeem mei acht fysike GPU's kin fungearje as 56 firtuele GPU's. Multi-Instance GPU (MIG) technology kinne jo selektearje segminten fan ferskillende maten sawol ûnder de computing kearnen en as ûnderdiel fan cache ûnthâld en HBM2 ûnthâld, en se sille net konkurrearje mei elkoar foar bânbreedte.

NVIDIA DGX A100: debút Ampere-basearre platfoarm biedt fiif petaflops fan prestaasjes

It is de muoite wurdich op te merken dat yn ferliking mei eardere DGX-systemen, de anatomy fan 'e DGX A100 wat feroaringen hat ûndergien. It oantal waarmtepipes yn 'e radiatoren fan' e SXM3-modules, wêrop A100-grafyske processors mei HBM2-ûnthâld ynstalleare binne, is gâns tanommen yn ferliking mei de Tesla V100-modules fan 'e Volta-generaasje, hoewol har úteinen binne ferburgen foar it sicht fan' e gemiddelde persoan troch de boppeste dekken. De praktyske limyt foar dit ûntwerp is 400 W termyske enerzjy. Dit wurdt ek befêstige troch de offisjele skaaimerken fan 'e A100 yn' e SXM3-ferzje, hjoed publisearre.

Njonken de A100 GPU's op it moederbord binne seis tredde-generaasje NVLink-ynterface-skeakels, dy't tegearre twa-wei gegevensútwikseling leverje mei in snelheid fan 4,8 TB / s. NVIDIA soarge ek serieus foar har koeling, te beoardieljen troch de folsleine-profyl radiatoren mei waarmtepipes. Elke GPU wurdt tawiisd oan 12 kanalen fan 'e NVLink-ynterface; oanbuorjende GPU's kinne gegevens útwikselje mei in snelheid fan 600 GB / s.

It DGX A100-systeem befettet ek njoggen Mellanox ConnectX-6 HDR-netwurkcontrollers, dy't yn steat binne om ynformaasje te ferstjoeren mei snelheden fan maksimaal 200 Gbit / s. Yn totaal leveret de DGX A100 twa-wei gegevensferfier mei in snelheid fan 3,6 TB / s. It systeem brûkt ek proprietêre Mellanox-technologyen dy't rjochte binne op effisjinte skaalfergrutting fan komputersystemen mei sa'n arsjitektuer. PCI Express 4.0-stipe op platfoarmnivo wurdt bepaald troch AMD EPYC Rome-generaasjeprozessors; as gefolch wurdt dizze ynterface net allinich brûkt troch A100-grafyske accelerators, mar ek troch solid-state-driven mei it NVMe-protokol.

NVIDIA DGX A100: debút Ampere-basearre platfoarm biedt fiif petaflops fan prestaasjes

Neist de DGX A100 is NVIDIA begon te leverjen oan har partners mei HGX A100-boards, dy't ien fan 'e komponinten binne fan serversystemen dy't oare fabrikanten op har eigen sille produsearje. In inkele HGX A100-boerd kin fjouwer of acht NVIDIA A100 GPU's pleatse. Derneist hat NVIDIA foar har eigen behoeften al DGX SuperPOD gearstald - in kluster fan 140 DGX A100-systemen, dy't prestaasjes leverje op 700 petaflops mei frij beskieden algemiene dimensjes. It bedriuw beloofde metodologyske bystân te jaan oan partners dy't ferlykbere komputerklusters wolle bouwe op basis fan de DGX A100. Trouwens, it duorre NVIDIA net mear as in moanne om de DGX SuperPOD te bouwen ynstee fan ferskate moannen of sels jierren typysk foar sokke taken.

NVIDIA DGX A100: debút Ampere-basearre platfoarm biedt fiif petaflops fan prestaasjes

Neffens NVIDIA binne leveringen fan 'e DGX A100 al begon op in priis fan $ 199 per kopy, de partners fan it bedriuw hostje dizze systemen al yn har wolkklusters, it ekosysteem beslacht al 000 lannen, ynklusyf Fietnam en de UAE. Derneist sille grafyske oplossingen mei Ampere-arsjitektuer frij foarsisber diel útmeitsje fan it Perlmutter-supercomputersysteem, makke troch Cray foar it US Department of Energy. It sil bestean út NVIDIA Ampere grafyske processors neist AMD EPYC Milan generaasje sintrale processors mei Zen 26-arsjitektuer. Supercomputer knooppunten basearre op NVIDIA Ampere sille berikke de klant yn 'e twadde helte fan it jier, hoewol't de earste eksimplaren binne al oankommen by it spesjalisearre laboratoarium fan de Amerikaanske ôfdieling.



Boarne: 3dnews.ru

Add a comment