NVIDIA DGX A100: Destpêka platforma Ampere-based pênc petaflops performansê pêşkêşî dike

Pergala DGX A100, ku li ser bingeha ku Jen-Hsun Huang vê dawiyê ye ji tenûrê derxist, heşt GPU A100, şeş guheztinên NVLink 3.0, neh kontrolkerên torê Mellanox, du pêvajoyên nifşê AMD EPYC Romê bi 64 core, 1 TB RAM û 15 TB SSD-yên bi piştgiriya NVMe vedihewîne.

NVIDIA DGX A100: Destpêka platforma Ampere-based pênc petaflops performansê pêşkêşî dike

NVIDIA DGX A100 nifşê sêyem ê pergalên hesabkirinê yên pargîdanî ye, ku di serî de ji bo çareserkirina pirsgirêkên îstîxbarata sûnî hatî çêkirin. Naha pergalên weha li ser pêvajoyên grafîkî yên herî dawî A100 ji malbata Ampere têne çêkirin, ku dibe sedema zêdebûna performansa wan, ku gihîştiye 5 petaflops. Bi saya vê yekê, DGX A100 dikare modelên AI-ê pir tevlihevtir û cildên daneya pir mezin bi dest bixe.

Ji bo pergala DGX A100, NVIDIA tenê mîqdara giştî ya bîranîna HBM2 nîşan dide, ku digihîje 320 GB. Hesabên arîtmetîk ên hêsan dihêlin ku em destnîşan bikin ku her GPU 40 GB bîranîn heye, û wêneyên hilbera nû eşkere dikin ku ev cild di nav şeş stûnan de tê belav kirin. Di heman demê de pêlava bîranîna grafîkê jî tê gotin - 12,4 TB / s ji bo tevahiya pergala DGX A100 bi tevahî.

Bihesibînin ku pergala DGX-1, li ser bingeha heşt Tesla V100-an, yek petaflops di nav hesabên rast-hevber de hilberand, û tê îddîa kirin ku DGX A100 di pênc petaflops de pêk tîne, em dikarin texmîn bikin ku di hesabên taybetî de yek Ampere GPU pênc carî zûtir ji selefê xwe bi mîmariya Volta. Di hin rewşan de, avantaj bîst qat dibe.

NVIDIA DGX A100: Destpêka platforma Ampere-based pênc petaflops performansê pêşkêşî dike

Bi tevahî, pergala DGX A8 performansa lûtkeyê ya 100 operasyonan di çirkeyê de di operasyonên yekjimar (INT1016) de, di operasyonên niqteya herikandinê ya nîv-rast (FP16) de - 5 petaflops, di operasyonên xala herikandinê de duqat-rast (FP64) - 156 teraflops peyda dike. . Digel vê yekê, DGX A32 di jimartina tensorê ya TF100 de performansa herî bilind a 2,5 petaflops bi dest dixe. Em bînin bîra xwe ku yek teraflops di çirkekê de 1012 operasyonên xala herikandinê ye, yek petaflops di çirkekê de 1015 operasyonên xala herikandinê ye.

Taybetmendiyek girîng a bilezkerên NVIDIA A100 şiyana dabeşkirina çavkaniyên yek GPU li heft beşên virtual e. Ev dihêle hûn di heman beşa ewr de nermbûna mîhengê bi girîngî zêde bikin. Mînakî, yek pergala DGX A100 bi heşt GPU-yên laşî dikare wekî 56 GPU-yên virtual tevbigere. Teknolojiya GPU (MIG) Pir-Nimûne dihêle hûn hem di nav navokên hesabkerê û hem jî wekî beşek bîranîna cache û bîranîna HBM2 de beşên bi pîvanên cihêreng hilbijêrin, û ew ê ji bo firehiya bandê bi hev re nekevin pêşbaziyê.

NVIDIA DGX A100: Destpêka platforma Ampere-based pênc petaflops performansê pêşkêşî dike

Hêjayî gotinê ye ku li gorî pergalên berê yên DGX, anatomiya DGX A100 hin guhertin derbas kiriye. Hejmara lûleyên germê yên di radyatorên modulên SXM3 de, ku li ser wan pêvajokên grafîkî yên A100 bi bîranîna HBM2 hatine saz kirin, li gorî modulên Tesla V100 yên nifşê Volta pir zêde bûye, her çend dawiya wan ji dîtina mirovê navîn veşartî ye. ji hêla pêlên jorîn ve. Sînorê pratîkî ji bo vê sêwiranê 400 W enerjiya termal e. Ev jî ji hêla taybetmendiyên fermî yên A100-ê ve di guhertoya SXM3 de, ku îro hatî weşandin, tê pejirandin.

Li kêleka GPU-yên A100-ê yên li ser motherboard-ê şeş ​​guhêrbarên navbeynkariya NVLink-a nifşa sêyemîn hene, ku bi hev re danûstandina daneya du-alî bi leza 4,8 TB/s peyda dikin. NVIDIA di heman demê de bal kişand ser sarbûna wan, ku ji hêla radyatorên tam-profilî yên bi lûleyên germê ve têne darizandin. Ji her GPU re 12 kanalên pêwendiya NVLink tê veqetandin; GPU-yên cîran dikarin bi leza 600 GB/s daneyan biguhezînin.

Pergala DGX A100 di heman demê de neh kontrolkerên torê Mellanox ConnectX-6 HDR jî hene, ku dikarin bi leza 200 Gbit / s agahdariya veguhezînin. Bi tevahî, DGX A100 veguheztina daneya du-alî bi leza 3,6 TB / s peyda dike. Pergal di heman demê de teknolojiyên Mellanox-ê yên xwedan bikar tîne ku mebesta pîvandina bikêrhatî ya pergalên hesabkirinê yên bi mîmariyek wusa ye. Piştgiriya PCI Express 4.0 di asta platformê de ji hêla pêvajoyên nifşê AMD EPYC Rome ve tê destnîşankirin; Wekî encamek, ev navbeynkar ne tenê ji hêla bilezkerên grafîkî yên A100, lê di heman demê de ji hêla ajokarên dewleta zexm ên bi protokola NVMe ve tê bikar anîn.

NVIDIA DGX A100: Destpêka platforma Ampere-based pênc petaflops performansê pêşkêşî dike

Digel DGX A100, NVIDIA dest bi peydakirina hevalbendên xwe bi panelên HGX A100 kiriye, ku yek ji hêmanên pergalên serverê ne ku hilberînerên din dê bi serê xwe hilberînin. Yek panelek HGX A100 dikare çar an heşt GPU-yên NVIDIA A100 bicîh bîne. Wekî din, ji bo hewcedariyên xwe, NVIDIA berê DGX SuperPOD berhev kiriye - komek ji 140 pergalên DGX A100, ku performansê li 700 petaflops bi pîvanên giştî yên pir nerm peyda dike. Pargîdanî soz da ku arîkariya metodolojîkî bide hevkarên ku dixwazin li ser bingeha DGX A100 komikên hesabker ên wekhev ava bikin. Bi awayê, NVIDIA ne bêtir ji mehekê girt ku DGX SuperPOD-ê li şûna çend meh an tewra sal jî ji bo karên weha tîpî ava bike.

NVIDIA DGX A100: Destpêka platforma Ampere-based pênc petaflops performansê pêşkêşî dike

Li gorî NVIDIA, radestkirina DGX A100 jixwe bi bihayek 199 $ her kopiyek dest pê kiriye, hevkarên pargîdanî berê van pergalan di komikên ewr de mêvandar dikin, ekosîstema berê 000 welatan vedihewîne, di nav de Viyetnam û UAE. Wekî din, çareseriyên grafîkî yên bi mîmariya Ampere dê bi pêşbînîkirî bibin beşek ji pergala supercomputer Perlmutter, ku ji hêla Cray ve ji bo Wezareta Enerjiyê ya Dewletên Yekbûyî hatî afirandin. Ew ê ji pêvajoyên grafîkê yên NVIDIA Ampere li gel pêvajoyên navendî yên nifşê AMD EPYC Milan bi mîmariya Zen 26 pêk were. Girêkên superkomputerê yên li ser bingeha NVIDIA Ampere dê di nîvê duyemîn a salê de bigihîjin xerîdar, her çend kopiyên yekem berê gihîştine laboratûara pispor. wezareta Amerîkî.



Source: 3dnews.ru

Add a comment