NVIDIA DGX A100: platforma debutuese e bazuar në Ampere ofron pesë petaflops të performancës

Sistemi DGX A100, i bazuar në të cilin Jen-Hsun Huang kohët e fundit e nxori nga furra, përfshin tetë GPU A100, gjashtë ndërprerës NVLink 3.0, nëntë kontrollues të rrjetit Mellanox, dy procesorë AMD EPYC të gjeneratës së Romës me 64 bërthama, 1 TB RAM dhe 15 TB SSD me mbështetje NVMe.

NVIDIA DGX A100: platforma debutuese e bazuar në Ampere ofron pesë petaflops të performancës

NVIDIA DGX A100 është gjenerata e tretë e sistemeve kompjuterike të kompanisë, e krijuar kryesisht për zgjidhjen e problemeve të inteligjencës artificiale. Tani sisteme të tilla janë ndërtuar në procesorët më të fundit grafik A100 nga familja Ampere, gjë që shkakton një rritje të mprehtë të performancës së tyre, e cila ka arritur në 5 petaflops. Falë kësaj, DGX A100 është në gjendje të trajtojë modele shumë më komplekse të AI dhe vëllime shumë më të mëdha të të dhënave.

Për sistemin DGX A100, NVIDIA tregon vetëm sasinë totale të memories HBM2, e cila arrin 320 GB. Llogaritjet e thjeshta aritmetike na lejojnë të përcaktojmë se çdo GPU ka 40 GB memorie dhe imazhet e produktit të ri e bëjnë të qartë se ky vëllim shpërndahet në gjashtë rafte. Përmendet gjithashtu gjerësia e brezit të memories grafike - 12,4 TB / s për të gjithë sistemin DGX A100 në total.

Duke marrë parasysh që sistemi DGX-1, i bazuar në tetë Tesla V100, prodhoi një petaflops në llogaritjet me precizion të përzier, dhe DGX A100 pretendohet se funksionon me pesë petaflops, mund të supozojmë se në llogaritjet specifike një GPU Ampere është pesë herë më e shpejtë se paraardhësi i tij me arkitekturën Volta. Në disa raste, avantazhi bëhet njëzetfish.

NVIDIA DGX A100: platforma debutuese e bazuar në Ampere ofron pesë petaflops të performancës

Në total, sistemi DGX A8 ofron një performancë maksimale prej 100 operacionesh për sekondë në operacionet me numër të plotë (INT1016), në operacionet me pikë lundruese gjysmë precize (FP16) - 5 petaflops, në operacionet me pikë lundruese me saktësi të dyfishtë (FP64) - 156 teraflops . Për më tepër, DGX A32 arrin një performancë maksimale prej 100 petaflops në llogaritjen tensor TF2,5. Le të kujtojmë se një teraflops është 1012 operacione me pikë lundruese për sekondë, një petaflops është 1015 operacione me pikë lundruese për sekondë.

Një tipar i rëndësishëm i përshpejtuesve NVIDIA A100 është aftësia për të ndarë burimet e një GPU në shtatë segmente virtuale. Kjo ju lejon të rritni ndjeshëm fleksibilitetin e konfigurimit në të njëjtin segment cloud. Për shembull, një sistem DGX A100 me tetë GPU fizike mund të veprojë si 56 GPU virtuale. Teknologjia GPU me shumë instanca (MIG) ju lejon të zgjidhni segmente të madhësive të ndryshme si midis bërthamave informatike, ashtu edhe si pjesë e memories cache dhe memories HBM2, dhe ato nuk do të konkurrojnë me njëri-tjetrin për gjerësinë e brezit.

NVIDIA DGX A100: platforma debutuese e bazuar në Ampere ofron pesë petaflops të performancës

Vlen të përmendet se në krahasim me sistemet e mëparshme DGX, anatomia e DGX A100 ka pësuar disa ndryshime. Numri i tubave të nxehtësisë në radiatorët e moduleve SXM3, mbi të cilët janë instaluar procesorë grafik A100 me memorie HBM2, është rritur ndjeshëm në krahasim me modulet Tesla V100 të gjeneratës Volta, megjithëse skajet e tyre janë të fshehura nga pamja e personit mesatar. nga mbulesat e sipërme. Kufiri praktik për këtë dizajn është 400 W energji termike. Kjo konfirmohet edhe nga karakteristikat zyrtare të A100 në versionin SXM3, të publikuara sot.

Pranë GPU-ve A100 në motherboard janë gjashtë ndërprerës të ndërfaqes NVLink të gjeneratës së tretë, të cilët së bashku ofrojnë shkëmbim të dyanshëm të të dhënave me një shpejtësi prej 4,8 TB/s. NVIDIA është kujdesur seriozisht edhe për ftohjen e tyre, duke gjykuar nga radiatorët e profilit të plotë me tuba ngrohjeje. Çdo GPU i ndahen 12 kanale të ndërfaqes NVLink; GPU-të fqinje mund të shkëmbejnë të dhëna me një shpejtësi prej 600 GB/s.

Sistemi DGX A100 strehon gjithashtu nëntë kontrollues të rrjetit Mellanox ConnectX-6 HDR, të aftë për të transmetuar informacion me shpejtësi deri në 200 Gbit/s. Në total, DGX A100 siguron transferim të dyanshëm të të dhënave me një shpejtësi prej 3,6 TB/s. Sistemi përdor gjithashtu teknologji të pronarit Mellanox që synojnë shkallëzimin efikas të sistemeve kompjuterike me një arkitekturë të tillë. Mbështetja e PCI Express 4.0 në nivelin e platformës përcaktohet nga procesorët e gjenerimit të AMD EPYC Rome; si rezultat, kjo ndërfaqe përdoret jo vetëm nga përshpejtuesit grafikë A100, por edhe nga disqet në gjendje të ngurtë me protokollin NVMe.

NVIDIA DGX A100: platforma debutuese e bazuar në Ampere ofron pesë petaflops të performancës

Përveç DGX A100, NVIDIA ka filluar të furnizojë partnerët e saj me pllaka HGX A100, të cilat janë një nga komponentët e sistemeve të serverëve që prodhuesit e tjerë do të prodhojnë vetë. Një tabelë e vetme HGX A100 mund të strehojë ose katër ose tetë GPU NVIDIA A100. Për më tepër, për nevojat e veta, NVIDIA ka mbledhur tashmë DGX SuperPOD - një grup prej 140 sistemesh DGX A100, duke ofruar performancë në 700 petaflops me dimensione të përgjithshme mjaft modeste. Kompania premtoi të sigurojë ndihmë metodologjike për partnerët që dëshirojnë të ndërtojnë grupime të ngjashme kompjuterike bazuar në DGX A100. Nga rruga, NVIDIA-s iu desh jo më shumë se një muaj për të ndërtuar DGX SuperPOD në vend të disa muajve apo edhe viteve tipike për detyra të tilla.

NVIDIA DGX A100: platforma debutuese e bazuar në Ampere ofron pesë petaflops të performancës

Sipas NVIDIA, dërgesat e DGX A100 kanë filluar tashmë me një çmim prej 199 dollarë për kopje, partnerët e kompanisë tashmë po i presin këto sisteme në grupet e tyre cloud, ekosistemi tashmë mbulon 000 vende, përfshirë Vietnamin dhe Emiratet e Bashkuara Arabe. Për më tepër, zgjidhjet grafike me arkitekturë Ampere do të jenë mjaft të parashikueshme pjesë e sistemit superkompjuterik Perlmutter, krijuar nga Cray për Departamentin e Energjisë të SHBA. Ai do të përfshijë GPU-të NVIDIA Ampere së bashku me procesorët qendrorë të gjeneratës AMD EPYC Milan me arkitekturë Zen 26. Nyjet e superkompjuterëve të bazuara në NVIDIA Ampere do të arrijnë te klienti në gjysmën e dytë të vitit, megjithëse kopjet e para tashmë kanë mbërritur në laboratorin e specializuar të amerikanit. departamenti.



Burimi: 3dnews.ru

Shto një koment