NVIDIA DGX A100: debyut Amperga asoslangan platforma besh petaflop ishlashni taklif qiladi

DGX A100 tizimi, unga asoslangan yaqinda Jen-Xsun Huang pechdan chiqarib oldi, sakkizta A100 GPU, oltita NVLink 3.0 kalitlari, to‘qqizta Mellanox tarmoq kontrollerlari, 64 yadroli ikkita AMD EPYC Rim avlod protsessorlari, 1 TB operativ xotira va NVMe qo‘llab-quvvatlanadigan 15 TB SSD’larni o‘z ichiga oladi.

NVIDIA DGX A100: debyut Amperga asoslangan platforma besh petaflop ishlashni taklif qiladi

NVIDIA DGX A100 - bu kompaniyaning uchinchi avlod hisoblash tizimlari bo'lib, asosan sun'iy intellekt muammolarini hal qilish uchun mo'ljallangan. Endi bunday tizimlar Ampere oilasining so'nggi A100 grafik protsessorlarida qurilgan bo'lib, bu ularning ishlashining keskin o'sishiga olib keladi, bu esa 5 petaflopsga yetdi. Buning yordamida DGX A100 ancha murakkab sun'iy intellekt modellari va ancha katta hajmdagi ma'lumotlar bilan ishlashga qodir.

DGX A100 tizimi uchun NVIDIA faqat 2 GB ga yetadigan HBM320 xotirasining umumiy hajmini bildiradi. Oddiy arifmetik hisob-kitoblar har bir GPU 40 Gb xotiraga ega ekanligini aniqlash imkonini beradi va yangi mahsulot tasvirlari bu hajm oltita stekga taqsimlanganligini aniq ko'rsatib beradi. Grafik xotiraning o'tkazish qobiliyati ham qayd etilgan - jami DGX A12,4 tizimi uchun 100 TB / s.

Sakkizta Tesla V1-ga asoslangan DGX-100 tizimi aralash aniqlikdagi hisob-kitoblarda bir petaflops ishlab chiqarganini va DGX A100 besh petaflopda ishlashini e'tiborga olsak, biz aniq hisob-kitoblarda bir Amper GPU oldingisidan besh baravar tezroq ekanligini taxmin qilishimiz mumkin. Volta arxitekturasi bilan. Ba'zi hollarda afzallik yigirma baravar ko'payadi.

NVIDIA DGX A100: debyut Amperga asoslangan platforma besh petaflop ishlashni taklif qiladi

Hammasi bo'lib, DGX A8 tizimi butun sonli operatsiyalarda (INT100) soniyasiga 1016 operatsiyani, yarim aniqlikdagi suzuvchi nuqta operatsiyalarida (FP16) - 5 petaflops, ikki aniqlikdagi suzuvchi nuqta operatsiyalarida (FP64) - 156 teraflopsni ta'minlaydi. . Bundan tashqari, DGX A32 TF100 tenzorli hisoblashda 2,5 petaflopning eng yuqori ko‘rsatkichlariga erishadi. Eslatib o'tamiz, bitta teraflops soniyada 1012 suzuvchi nuqta operatsiyasini, bir petaflop soniyada 1015 suzuvchi nuqta operatsiyasini tashkil qiladi.

NVIDIA A100 tezlatgichlarining muhim xususiyati bitta GPU resurslarini ettita virtual segmentga bo'lish qobiliyatidir. Bu sizga bir xil bulut segmentida konfiguratsiya moslashuvchanligini sezilarli darajada oshirish imkonini beradi. Misol uchun, sakkizta jismoniy GPUga ega bo'lgan bitta DGX A100 tizimi 56 virtual GPU vazifasini bajarishi mumkin. Multi-Instance GPU (MIG) texnologiyasi turli o'lchamdagi segmentlarni hisoblash yadrolari orasida ham, kesh xotirasi va HBM2 xotirasining bir qismi sifatida ham tanlash imkonini beradi va ular tarmoqli kengligi uchun bir-biri bilan raqobatlashmaydi.

NVIDIA DGX A100: debyut Amperga asoslangan platforma besh petaflop ishlashni taklif qiladi

Shunisi e'tiborga loyiqki, oldingi DGX tizimlari bilan solishtirganda, DGX A100 anatomiyasi ba'zi o'zgarishlarga duch keldi. HBM3 xotirali A100 grafik protsessorlari o'rnatilgan SXM2 modullarining radiatorlaridagi issiqlik quvurlari soni Volta avlodining Tesla V100 modullariga nisbatan sezilarli darajada oshdi, garchi ularning uchlari oddiy odamning ko'zidan yashiringan bo'lsa ham. yuqori qopqoqlar tomonidan. Ushbu dizaynning amaliy chegarasi 400 Vt issiqlik energiyasidir. Buni bugungi kunda nashr etilgan SXM100 versiyasidagi A3 ning rasmiy xarakteristikalari ham tasdiqlaydi.

Anakartdagi A100 grafik protsessorlari yonida oltita uchinchi avlod NVLink interfeysi kalitlari joylashgan bo‘lib, ular birgalikda 4,8 TB/s tezlikda ikki tomonlama ma’lumotlar almashinuvini ta’minlaydi. NVIDIA, shuningdek, issiqlik quvurlari bo'lgan to'liq profilli radiatorlarga ko'ra, ularning sovutilishiga jiddiy g'amxo'rlik qildi. Har bir GPUga NVLink interfeysining 12 ta kanali ajratilgan, qo'shni GPUlar 600 Gb/s tezlikda ma'lumot almashishi mumkin.

DGX A100 tizimida shuningdek, 6 Gbit/s gacha tezlikda axborotni uzatishga qodir bo‘lgan to‘qqizta Mellanox ConnectX-200 HDR tarmoq kontrollerlari joylashgan. Umuman olganda, DGX A100 3,6 TB/s tezlikda ikki tomonlama ma'lumotlarni uzatishni ta'minlaydi. Tizim shuningdek, bunday arxitekturaga ega hisoblash tizimlarini samarali masshtablashtirishga qaratilgan xususiy Mellanox texnologiyalaridan foydalanadi. Platforma darajasida PCI Express 4.0 qo'llab-quvvatlashi AMD EPYC Rim avlod protsessorlari tomonidan belgilanadi, natijada bu interfeys nafaqat A100 grafik tezlatgichlari, balki NVMe protokoli bilan qattiq holatdagi drayvlar tomonidan ham qo'llaniladi.

NVIDIA DGX A100: debyut Amperga asoslangan platforma besh petaflop ishlashni taklif qiladi

DGX A100 bilan bir qatorda, NVIDIA o'z hamkorlariga boshqa ishlab chiqaruvchilar mustaqil ravishda ishlab chiqaradigan server tizimlarining tarkibiy qismlaridan biri bo'lgan HGX A100 platalarini yetkazib berishni boshladi. Bitta HGX A100 platasi to‘rt yoki sakkizta NVIDIA A100 GPU-ni sig‘dira oladi. Bundan tashqari, NVIDIA o'z ehtiyojlari uchun allaqachon DGX SuperPOD - 140 ta DGX A100 tizimidan iborat klasterni yig'ib, 700 petaflops tezligida juda oddiy umumiy o'lchamlarga ega. Kompaniya DGX A100 negizida shunga o'xshash hisoblash klasterlarini qurish istagida bo'lgan hamkorlarga uslubiy yordam ko'rsatishga va'da berdi. Aytgancha, bunday vazifalar uchun odatiy bo'lgan bir necha oy yoki hatto yillar o'rniga DGX SuperPOD-ni yaratish uchun NVIDIA bir oydan ko'proq vaqt talab qildi.

NVIDIA DGX A100: debyut Amperga asoslangan platforma besh petaflop ishlashni taklif qiladi

NVIDIA ma'lumotlariga ko'ra, DGX A100 yetkazib berish allaqachon bir nusxasi uchun 199 000 dollardan boshlangan, kompaniya hamkorlari allaqachon ushbu tizimlarni o'zlarining bulutli klasterlarida joylashtirmoqda, ekotizim allaqachon 26 mamlakatni, jumladan Vetnam va BAAni qamrab olgan. Bundan tashqari, Amper arxitekturasiga ega grafik echimlar AQSh Energetika vazirligi uchun Cray tomonidan yaratilgan Perlmutter superkompyuter tizimining bir qismi bo'ladi. U Zen 3 arxitekturasiga ega AMD EPYC Milan avlod markaziy protsessorlari bilan bir qatorda NVIDIA Ampere grafik protsessorlaridan iborat bo'ladi.NVIDIA Ampere asosidagi superkompyuter tugunlari mijozga yilning ikkinchi yarmida yetib boradi, garchi birinchi nusxalar ixtisoslashtirilgan laboratoriyaga yetib borgan bo'lsa ham. Amerika bo'limi.



Manba: 3dnews.ru

a Izoh qo'shish