NVIDIA DGX A100: Debüt Amper Platforması Beş Petaflop Performans verir

Bu yaxınlarda Jen-Hsun Huang-a əsaslanan DGX A100 sistemi sobadan çıxartdı, səkkiz A100 GPU, altı NVLink 3.0 açarı, doqquz Mellanox şəbəkə nəzarətçisi, 64 nüvəli iki AMD EPYC Rome nəsil prosessoru, 1 TB RAM və NVMe dəstəyi ilə 15 TB SSD daxildir.

NVIDIA DGX A100: Debüt Amper Platforması Beş Petaflop Performans verir

NVIDIA DGX A100, ilk növbədə süni intellekt problemlərinin həlli üçün nəzərdə tutulmuş şirkətin hesablama sistemlərinin üçüncü nəslidir. İndi bu cür sistemlər Ampere ailəsindən olan ən son A100 qrafik prosessorları üzərində qurulur ki, bu da onların performansının kəskin artmasına səbəb olur və bu, 5 petaflop-a çatır. Bunun sayəsində DGX A100 daha mürəkkəb süni intellekt modellərini və daha böyük həcmdə məlumatı idarə edə bilir.

DGX A100 sistemi üçün NVIDIA yalnız 2 GB-a çatan HBM320 yaddaşının ümumi həcmini göstərir. Sadə arifmetik hesablamalar hər bir GPU-nun 40 GB yaddaşa malik olduğunu müəyyən etməyə imkan verir və yeni məhsulun təsvirləri bu həcmin altı yığın arasında paylandığını aydın göstərir. Qrafik yaddaşın ötürmə qabiliyyəti də qeyd olunur - ümumilikdə bütün DGX A12,4 sistemi üçün 100 TB/s.

Səkkiz Tesla V1-ə əsaslanan DGX-100 sisteminin qarışıq dəqiqlikli hesablamalarda bir petaflop istehsal etdiyini və DGX A100-ün beş petaflopda çıxış etdiyini nəzərə alsaq, xüsusi hesablamalarda bir Amper GPU-nun beş dəfə daha sürətli olduğunu güman edə bilərik. Volta arxitekturası ilə sələfi. Bəzi hallarda üstünlük iyirmi qat olur.

NVIDIA DGX A100: Debüt Amper Platforması Beş Petaflop Performans verir

Ümumilikdə, DGX A8 sistemi tam əməliyyatlarda (INT100) saniyədə 1016 əməliyyat, yarımdəqiqlikli üzən nöqtə əməliyyatlarında (FP16) - 5 petaflops, ikiqat dəqiqlikli üzən nöqtə əməliyyatlarında (FP64) - 156 teraflops maksimum performans təmin edir. . Bundan əlavə, DGX A32 TF100 tenzor hesablamasında 2,5 petaflops maksimum performansa nail olur. Yada salaq ki, bir teraflop saniyədə 1012 üzən nöqtə əməliyyatı, bir petaflop saniyədə 1015 üzən nöqtə əməliyyatıdır.

NVIDIA A100 sürətləndiricilərinin mühüm xüsusiyyəti bir GPU-nun resurslarını yeddi virtual seqmentə bölmək qabiliyyətidir. Bu, eyni bulud seqmentində konfiqurasiya çevikliyini əhəmiyyətli dərəcədə artırmağa imkan verir. Məsələn, səkkiz fiziki GPU ilə bir DGX A100 sistemi 56 virtual GPU kimi çıxış edə bilər. Multi-Instance GPU (MIG) texnologiyası həm hesablama nüvələri arasında, həm də keş yaddaşının və HBM2 yaddaşının bir hissəsi kimi müxtəlif ölçülü seqmentləri seçməyə imkan verir və onlar bant genişliyi üçün bir-biri ilə rəqabət aparmayacaqlar.

NVIDIA DGX A100: Debüt Amper Platforması Beş Petaflop Performans verir

Qeyd etmək lazımdır ki, əvvəlki DGX sistemləri ilə müqayisədə DGX A100-ün anatomiyası müəyyən dəyişikliklərə məruz qalıb. HBM3 yaddaşlı A100 qrafik prosessorlarının quraşdırıldığı SXM2 modullarının radiatorlarında istilik borularının sayı Volta nəslinin Tesla V100 modulları ilə müqayisədə xeyli artmışdır, baxmayaraq ki, onların ucları adi insanın gözündən gizlədilir. üst örtüklər tərəfindən. Bu dizayn üçün praktiki limit 400 W istilik enerjisidir. Bunu SXM100 versiyasında A3-ün bu gün dərc edilən rəsmi xüsusiyyətləri də təsdiqləyir.

Ana platadakı A100 GPU-larının yanında altı üçüncü nəsil NVLink interfeys açarı var ki, bunlar birlikdə 4,8 TB/s sürətlə ikitərəfli məlumat mübadiləsini təmin edir. NVIDIA, istilik boruları olan tam profilli radiatorlara görə də onların soyudulmasına ciddi diqqət yetirdi. Hər bir GPU-ya NVLink interfeysinin 12 kanalı ayrılır; qonşu GPU-lar 600 GB/s sürətlə məlumat mübadiləsi edə bilir.

DGX A100 sistemində həmçinin 6 Gbit/s-ə qədər sürətlə məlumat ötürməyə qadir olan doqquz Mellanox ConnectX-200 HDR şəbəkə nəzarətçiləri var. Ümumilikdə, DGX A100 3,6 TB/s sürətlə ikitərəfli məlumat ötürülməsini təmin edir. Sistem həmçinin belə bir arxitekturaya malik hesablama sistemlərinin səmərəli miqyasına yönəldilmiş özəl Mellanox texnologiyalarından istifadə edir. Platforma səviyyəsində PCI Express 4.0 dəstəyi AMD EPYC Rome nəsil prosessorları tərəfindən müəyyən edilir; nəticədə bu interfeys yalnız A100 qrafik sürətləndiriciləri tərəfindən deyil, həm də NVMe protokolu ilə bərk vəziyyətdə olan disklər tərəfindən istifadə olunur.

NVIDIA DGX A100: Debüt Amper Platforması Beş Petaflop Performans verir

DGX A100-ə əlavə olaraq, NVIDIA tərəfdaşlarını digər istehsalçıların özləri istehsal edəcəyi server sistemlərinin komponentlərindən biri olan HGX A100 lövhələri ilə təchiz etməyə başlayıb. Tək HGX A100 lövhəsi dörd və ya səkkiz NVIDIA A100 GPU-nu yerləşdirə bilər. Bundan əlavə, öz ehtiyacları üçün NVIDIA artıq DGX SuperPOD - 140 DGX A100 sistemindən ibarət klaster yığıb və kifayət qədər təvazökar ümumi ölçüləri ilə 700 petaflopda performans təmin edir. Şirkət DGX A100 əsasında analoji hesablama klasterləri qurmaq istəyən tərəfdaşlara metodiki kömək göstərəcəyini vəd edib. Yeri gəlmişkən, bu cür tapşırıqlar üçün xarakterik olan bir neçə ay və ya hətta il əvəzinə DGX SuperPOD-u qurmaq üçün NVIDIA bir aydan çox çəkmədi.

NVIDIA DGX A100: Debüt Amper Platforması Beş Petaflop Performans verir

NVIDIA-nın məlumatına görə, DGX A100-ün hər nüsxəsi üçün 199 dollar qiymətlə tədarüklərə başlanılıb, şirkətin tərəfdaşları artıq bu sistemləri öz bulud klasterlərində yerləşdirirlər, ekosistem artıq Vyetnam və BƏƏ də daxil olmaqla 000 ölkəni əhatə edir. Bundan əlavə, Amper arxitekturasına malik qrafik həllər tamamilə proqnozlaşdırıla bilər ki, Cray tərəfindən ABŞ Energetika Nazirliyi üçün yaradılan Perlmutter superkompüter sisteminin bir hissəsi olacaq. O, Zen 26 arxitekturasına malik AMD EPYC Milan nəsil mərkəzi prosessorları ilə yanaşı NVIDIA Ampere qrafik prosessorlarından ibarət olacaq.NVIDIA Ampere əsasında superkompüter qovşaqları ilin ikinci yarısında müştəriyə çatacaq, baxmayaraq ki, ilk nüsxələr artıq İxtisaslaşdırılmış laboratoriyaya gəlib. Amerika şöbəsi.



Mənbə: 3dnews.ru

Добавить комментарий