NVIDIA DGX A100: jukwaa la msingi la Ampere hutoa petaflops tano za utendakazi

Mfumo wa DGX A100, kulingana na ambayo Jen-Hsun Huang hivi karibuni alichukua nje ya tanuri, inajumuisha GPU nane za A100, swichi sita za NVLink 3.0, vidhibiti tisa vya mtandao vya Mellanox, wasindikaji wawili wa kizazi cha AMD EPYC Roma wenye cores 64, 1 TB ya RAM na 15 TB ya SSD kwa usaidizi wa NVMe.

NVIDIA DGX A100: jukwaa la msingi la Ampere hutoa petaflops tano za utendakazi

NVIDIA DGX A100 ni kizazi cha tatu cha mifumo ya kompyuta ya kampuni, iliyoundwa kwa ajili ya kutatua matatizo ya kijasusi bandia. Sasa mifumo kama hiyo imejengwa juu ya wasindikaji wa hivi karibuni wa A100 kutoka kwa familia ya Ampere, ambayo husababisha ongezeko kubwa la utendaji wao, ambao umefikia petaflops 5. Shukrani kwa hili, DGX A100 ina uwezo wa kushughulikia mifano ngumu zaidi ya AI na idadi kubwa zaidi ya data.

Kwa mfumo wa DGX A100, NVIDIA inaonyesha tu jumla ya kumbukumbu ya HBM2, ambayo hufikia GB 320. Hesabu rahisi za hesabu huturuhusu kubaini kuwa kila GPU ina kumbukumbu ya GB 40, na picha za bidhaa mpya zinaonyesha wazi kuwa kiasi hiki kinasambazwa kati ya rafu sita. Bandwidth ya kumbukumbu ya picha pia imetajwa - 12,4 TB / s kwa mfumo mzima wa DGX A100 kwa jumla.

Kwa kuzingatia kwamba mfumo wa DGX-1, unaozingatia Tesla V100 nane, ulitoa petaflops moja katika hesabu za usahihi mchanganyiko, na DGX A100 inadaiwa kufanya kwenye petaflops tano, tunaweza kudhani kuwa katika hesabu maalum Ampere GPU moja ina kasi mara tano kuliko mtangulizi wake na usanifu wa Volta. Katika baadhi ya matukio, faida inakuwa ishirini.

NVIDIA DGX A100: jukwaa la msingi la Ampere hutoa petaflops tano za utendakazi

Kwa jumla, mfumo wa DGX A8 hutoa utendaji wa kilele wa shughuli 100 kwa sekunde katika shughuli kamili (INT1016), katika shughuli za nusu-usahihi za sehemu ya kuelea (FP16) - 5 petaflops, katika operesheni za uhakika mbili za kuelea (FP64) - teraflops 156. . Zaidi ya hayo, DGX A32 inafikia utendakazi wa kilele wa petaflops 100 katika kompyuta ya tensor ya TF2,5. Tukumbuke kwamba teraflops moja ni shughuli 1012 za kuelea kwa sekunde, petaflops moja ni shughuli 1015 za kuelea kwa sekunde.

Kipengele muhimu cha vichapuzi vya NVIDIA A100 ni uwezo wa kugawanya rasilimali za GPU moja katika sehemu saba pepe. Hii hukuruhusu kuongeza kwa kiasi kikubwa kubadilika kwa usanidi katika sehemu sawa ya wingu. Kwa mfano, mfumo mmoja wa DGX A100 wenye GPU nane halisi unaweza kufanya kazi kama GPU 56 pepe. Teknolojia ya Multi-Instance GPU (MIG) hukuruhusu kuchagua sehemu za saizi tofauti kati ya cores za kompyuta na kama sehemu ya kumbukumbu ya kache na kumbukumbu ya HBM2, na hazitashindana kwa kipimo data.

NVIDIA DGX A100: jukwaa la msingi la Ampere hutoa petaflops tano za utendakazi

Inafaa kumbuka kuwa ikilinganishwa na mifumo ya zamani ya DGX, anatomy ya DGX A100 imepata mabadiliko kadhaa. Idadi ya mabomba ya joto kwenye radiators za moduli za SXM3, ambayo wasindikaji wa picha za A100 na kumbukumbu ya HBM2 imewekwa, imeongezeka kwa kiasi kikubwa ikilinganishwa na moduli za Tesla V100 za kizazi cha Volta, ingawa mwisho wao umefichwa kutoka kwa mtazamo wa mtu wa kawaida. kwa vifuniko vya juu. Kikomo cha vitendo kwa kubuni hii ni 400 W ya nishati ya joto. Hii pia inathibitishwa na sifa rasmi za A100 katika toleo la SXM3, iliyochapishwa leo.

Karibu na GPU za A100 kwenye ubao mama kuna swichi sita za kiolesura cha NVLink za kizazi cha tatu, ambazo kwa pamoja hutoa ubadilishanaji wa data wa njia mbili kwa kasi ya 4,8 TB/s. NVIDIA pia ilijali sana upoezaji wao, kwa kuzingatia radiators kamili zilizo na mabomba ya joto. Kila GPU imetengewa chaneli 12 za kiolesura cha NVLink; GPU za jirani zinaweza kubadilishana data kwa kasi ya 600 GB/s.

Mfumo wa DGX A100 pia una vidhibiti tisa vya mtandao vya Mellanox ConnectX-6 HDR, vinavyoweza kusambaza taarifa kwa kasi ya hadi 200 Gbit/s. Kwa jumla, DGX A100 hutoa uhamisho wa data wa njia mbili kwa kasi ya 3,6 TB / s. Mfumo pia hutumia teknolojia za umiliki za Mellanox zinazolenga kuongeza ufanisi wa mifumo ya kompyuta na usanifu kama huo. Usaidizi wa PCI Express 4.0 katika ngazi ya jukwaa imedhamiriwa na wasindikaji wa kizazi cha AMD EPYC Roma; kwa sababu hiyo, interface hii haitumiwi tu na vichapuzi vya picha za A100, lakini pia na anatoa za hali-dhabiti na itifaki ya NVMe.

NVIDIA DGX A100: jukwaa la msingi la Ampere hutoa petaflops tano za utendakazi

Mbali na DGX A100, NVIDIA imeanza kusambaza washirika wake na bodi za HGX A100, ambazo ni mojawapo ya vipengele vya mifumo ya seva ambayo wazalishaji wengine watazalisha peke yao. Bodi moja ya HGX A100 inaweza kuchukua GPU nne au nane za NVIDIA A100. Kwa kuongezea, kwa mahitaji yake yenyewe, NVIDIA tayari imekusanya DGX SuperPOD - nguzo ya mifumo 140 ya DGX A100, ikitoa utendaji katika petaflops 700 na vipimo vya kawaida vya kawaida. Kampuni iliahidi kutoa usaidizi wa mbinu kwa washirika wanaotaka kujenga makundi sawa ya kompyuta kulingana na DGX A100. Kwa njia, ilichukua NVIDIA si zaidi ya mwezi mmoja kujenga DGX SuperPOD badala ya miezi kadhaa au hata miaka ya kawaida kwa kazi hizo.

NVIDIA DGX A100: jukwaa la msingi la Ampere hutoa petaflops tano za utendakazi

Kulingana na NVIDIA, uwasilishaji wa DGX A100 tayari umeanza kwa bei ya $199 kwa nakala, washirika wa kampuni tayari wanapangisha mifumo hii katika vikundi vyao vya mawingu, mfumo wa ikolojia tayari unashughulikia nchi 000, pamoja na Vietnam na UAE. Kwa kuongezea, suluhu za michoro zilizo na usanifu wa Ampere zinatarajiwa kuwa sehemu ya mfumo wa kompyuta mkuu wa Perlmutter, ulioundwa na Cray kwa Idara ya Nishati ya Marekani. Itakuwa na vichakataji vya michoro vya NVIDIA Ampere pamoja na wasindikaji wa kizazi wa AMD EPYC Milan wenye usanifu wa Zen 26. Nodi za kompyuta kubwa kulingana na NVIDIA Ampere zitamfikia mteja katika nusu ya pili ya mwaka, ingawa nakala za kwanza tayari zimefika kwenye maabara maalum ya idara ya Marekani.



Chanzo: 3dnews.ru

Kuongeza maoni