NVIDIA DGX A100: Debuut Ampere-platform lewer vyf Petaflops van prestasie

Die DGX A100 stelsel, gebaseer op wat Jen-Hsun Huang onlangs het dit uit die oond gehaal, bevat agt A100 GPU's, ses NVLink 3.0-skakelaars, nege Mellanox-netwerkbeheerders, twee AMD EPYC Rome-generasie verwerkers met 64 kerne, 1 TB RAM en 15 TB SSD's met NVMe-ondersteuning.

NVIDIA DGX A100: Debuut Ampere-platform lewer vyf Petaflops van prestasie

NVIDIA DGX A100 is die derde generasie van die maatskappy se rekenaarstelsels, wat hoofsaaklik ontwerp is om kunsmatige intelligensie-probleme op te los. Nou word sulke stelsels gebou op die nuutste A100-grafiese verwerkers van die Ampere-familie, wat 'n skerp toename in hul werkverrigting veroorsaak, wat 5 petaflops bereik het. Danksy dit kan die DGX A100 baie meer komplekse KI-modelle en baie groter volumes data hanteer.

Vir die DGX A100-stelsel dui NVIDIA slegs die totale hoeveelheid HBM2-geheue aan, wat 320 GB bereik. Eenvoudige rekenkundige berekeninge stel ons in staat om te bepaal dat elke GPU 40 GB geheue het, en beelde van die nuwe produk maak dit duidelik dat hierdie volume oor ses stapels versprei is. Die grafiese geheue bandwydte word ook genoem - 12,4 TB / s vir die hele DGX A100-stelsel in totaal.

As in ag geneem word dat die DGX-1-stelsel, gebaseer op agt Tesla V100's, een petaflops in gemengde-presisie-berekeninge geproduseer het, en die DGX A100 beweer word om teen vyf petaflops te presteer, kan ons aanvaar dat in spesifieke berekeninge een Ampere GPU vyf keer vinniger is as sy voorganger met Volta-argitektuur. In sommige gevalle word die voordeel twintigvoudig.

NVIDIA DGX A100: Debuut Ampere-platform lewer vyf Petaflops van prestasie

In totaal bied die DGX A8-stelsel 'n piekprestasie van 100 bewerkings per sekonde in heelgetalbewerkings (INT1016), in halfpresisie swaaipuntbewerkings (FP16) - 5 petaflops, in dubbelpresisie swaaipuntbewerkings (FP64) - 156 teraflops . Boonop behaal die DGX A32 'n piekprestasie van 100 petaflops in TF2,5-tensor-berekening. Kom ons onthou dat een teraflops 1012 drywende punt bewerkings per sekonde is, een petaflops is 1015 swaaipuntbewerkings per sekonde.

'n Belangrike kenmerk van NVIDIA A100-versnellers is die vermoë om die hulpbronne van een GPU in sewe virtuele segmente te verdeel. Dit laat jou toe om konfigurasiebuigsaamheid in dieselfde wolksegment aansienlik te verhoog. Byvoorbeeld, een DGX A100-stelsel met agt fisiese GPU's kan as 56 virtuele GPU's optree. Multi-Instance GPU (MIG) tegnologie laat jou toe om segmente van verskillende groottes te kies, beide onder die rekenaarkerne en as deel van kasgeheue en HBM2-geheue, en hulle sal nie met mekaar meeding vir bandwydte nie.

NVIDIA DGX A100: Debuut Ampere-platform lewer vyf Petaflops van prestasie

Dit is opmerklik dat in vergelyking met vorige DGX-stelsels, die anatomie van die DGX A100 'n paar veranderinge ondergaan het. Die aantal hittepype in die verkoelers van die SXM3-modules, waarop A100-grafiese verwerkers met HBM2-geheue geïnstalleer is, het aansienlik toegeneem in vergelyking met die Tesla V100-modules van die Volta-generasie, alhoewel hul punte weggesteek is vir die deursnee persoon. by die boonste deksels. Die praktiese limiet vir hierdie ontwerp is 400 W se termiese energie. Dit word ook bevestig deur die amptelike kenmerke van die A100 in die SXM3-weergawe, wat vandag gepubliseer word.

Langs die A100 GPU's op die moederbord is ses derdegenerasie NVLink-koppelvlakskakelaars, wat saam tweerigting-data-uitruiling bied teen 'n spoed van 4,8 TB/s. NVIDIA het ook ernstig gesorg vir hul verkoeling, te oordeel aan die volprofielstralers met hittepype. Aan elke GPU word 12 kanale van die NVLink-koppelvlak toegeken; naburige GPU's kan data teen 'n spoed van 600 GB/s uitruil.

Die DGX A100-stelsel huisves ook nege Mellanox ConnectX-6 HDR-netwerkbeheerders, wat in staat is om inligting teen spoed van tot 200 Gbit/s oor te dra. In totaal bied die DGX A100 tweerigting-data-oordrag teen 'n spoed van 3,6 TB/s. Die stelsel gebruik ook eie Mellanox-tegnologieë wat gemik is op doeltreffende skaal van rekenaarstelsels met so 'n argitektuur. PCI Express 4.0-ondersteuning op platformvlak word bepaal deur AMD EPYC Rome-generasie-verwerkers; gevolglik word hierdie koppelvlak nie net deur A100 grafiese versnellers gebruik nie, maar ook deur vastetoestand-aandrywers met die NVMe-protokol.

NVIDIA DGX A100: Debuut Ampere-platform lewer vyf Petaflops van prestasie

Benewens die DGX A100, het NVIDIA sy vennote begin voorsien van HGX A100-borde, wat een van die komponente van bedienerstelsels is wat ander vervaardigers op hul eie sal vervaardig. 'n Enkele HGX A100-bord kan óf vier óf agt NVIDIA A100 GPU's akkommodeer. Daarbenewens, vir sy eie behoeftes, het NVIDIA reeds DGX SuperPOD saamgestel - 'n groep van 140 DGX A100-stelsels, wat werkverrigting lewer teen 700 petaflops met redelik beskeie algehele afmetings. Die maatskappy het belowe om metodologiese bystand te verskaf aan vennote wat soortgelyke rekenaarklusters wil bou gebaseer op die DGX A100. Terloops, dit het NVIDIA nie meer as 'n maand geneem om die DGX SuperPOD te bou in plaas van 'n paar maande of selfs jare wat tipies is vir sulke take nie.

NVIDIA DGX A100: Debuut Ampere-platform lewer vyf Petaflops van prestasie

Volgens NVIDIA het aflewerings van die DGX A100 reeds begin teen 'n prys van $199 000 per kopie, die maatskappy se vennote huisves reeds hierdie stelsels in hul wolkklusters, die ekosisteem dek reeds 26 lande, insluitend Viëtnam en die VAE. Boonop sal grafiese oplossings met Ampere-argitektuur redelik voorspelbaar deel wees van die Perlmutter-superrekenaarstelsel, geskep deur Cray vir die Amerikaanse departement van energie. Dit sal NVIDIA Ampere GPU's insluit saam met AMD EPYC Milan generasie sentrale verwerkers met Zen 3 argitektuur. Superrekenaar nodusse gebaseer op NVIDIA Ampere sal die kliënt in die tweede helfte van die jaar bereik, hoewel die eerste kopieë reeds by die gespesialiseerde laboratorium van die Amerikaanse aangekom het. departement.



Bron: 3dnews.ru

Voeg 'n opmerking