NVIDIA DGX A100: mae platfform cyntaf wedi'i seilio ar Ampere yn cynnig pum petaflop o berfformiad

Mae'r system DGX A100, yn seiliedig ar y Jen-Hsun Huang yn ddiweddar cymerodd ef allan o'r popty, yn cynnwys wyth GPU A100, chwe switsh NVLink 3.0, naw rheolydd rhwydwaith Mellanox, dau brosesydd AMD EPYC Rhufain-genhedlaeth gyda chraidd 64, 1 TB o RAM a 15 TB o SSDs gyda chefnogaeth NVMe.

NVIDIA DGX A100: mae platfform cyntaf wedi'i seilio ar Ampere yn cynnig pum petaflop o berfformiad

NVIDIA DGX A100 yw'r drydedd genhedlaeth o systemau cyfrifiadurol y cwmni, a gynlluniwyd yn bennaf ar gyfer datrys problemau deallusrwydd artiffisial. Nawr mae systemau o'r fath wedi'u hadeiladu ar y proseswyr graffeg A100 diweddaraf o'r teulu Ampere, sy'n achosi cynnydd sydyn yn eu perfformiad, sydd wedi cyrraedd 5 petaflops. Diolch i hyn, mae'r DGX A100 yn gallu trin modelau AI llawer mwy cymhleth a llawer mwy o ddata.

Ar gyfer y system DGX A100, mae NVIDIA yn nodi cyfanswm y cof HBM2 yn unig, sy'n cyrraedd 320 GB. Mae cyfrifiadau rhifyddol syml yn ein galluogi i benderfynu bod gan bob GPU 40 GB o gof, ac mae delweddau o'r cynnyrch newydd yn ei gwneud yn glir bod y gyfrol hon yn cael ei dosbarthu ymhlith chwe stac. Crybwyllir lled band cof graffeg hefyd - 12,4 TB / s ar gyfer y system DGX A100 gyfan i gyd.

O ystyried bod y system DGX-1, yn seiliedig ar wyth Tesla V100s, wedi cynhyrchu un petaflops mewn cyfrifiadau manwl-gywir, a honnir bod DGX A100 yn perfformio ar bum petaflops, gallwn dybio mewn cyfrifiadau penodol bod un GPU Ampere bum gwaith yn gyflymach na ei ragflaenydd gyda phensaernïaeth Volta. Mewn rhai achosion, mae'r fantais yn dod yn ugain gwaith.

NVIDIA DGX A100: mae platfform cyntaf wedi'i seilio ar Ampere yn cynnig pum petaflop o berfformiad

Yn gyfan gwbl, mae system DGX A8 yn darparu perfformiad brig o 100 o weithrediadau yr eiliad mewn gweithrediadau cyfanrif (INT1016), mewn gweithrediadau pwynt arnawf hanner manylder (FP16) - 5 petaflops, mewn gweithrediadau pwynt arnawf manwl-dwbl (FP64) - 156 teraflops . Yn ogystal, mae'r DGX A32 yn cyflawni perfformiad brig o 100 petaflops mewn cyfrifiadura tensor TF2,5. Gadewch inni gofio mai un teraflops yw 1012 o weithrediadau pwynt arnawf yr eiliad, un petaflops yw 1015 o weithrediadau pwynt arnawf yr eiliad.

Nodwedd bwysig o gyflymwyr NVIDIA A100 yw'r gallu i rannu adnoddau un GPU yn saith rhan rithwir. Mae hyn yn caniatáu ichi gynyddu hyblygrwydd cyfluniad yn sylweddol yn yr un segment cwmwl. Er enghraifft, gall un system DGX A100 gydag wyth GPU corfforol weithredu fel 56 GPU rhithwir. Mae technoleg GPU Aml-achos (MIG) yn caniatáu ichi ddewis segmentau o wahanol feintiau ymhlith y creiddiau cyfrifiadurol ac fel rhan o gof storfa a chof HBM2, ac ni fyddant yn cystadlu â'i gilydd am led band.

NVIDIA DGX A100: mae platfform cyntaf wedi'i seilio ar Ampere yn cynnig pum petaflop o berfformiad

Mae'n werth nodi, o'i gymharu â systemau DGX blaenorol, bod anatomeg DGX A100 wedi cael rhai newidiadau. Mae nifer y pibellau gwres yn rheiddiaduron y modiwlau SXM3, y mae proseswyr graffeg A100 â chof HBM2 wedi'u gosod arnynt, wedi cynyddu'n sylweddol o'i gymharu â modiwlau Tesla V100 y genhedlaeth Volta, er bod eu pennau wedi'u cuddio o olwg y person cyffredin. gan y cloriau uchaf. Y terfyn ymarferol ar gyfer y dyluniad hwn yw 400 W o ynni thermol. Mae hyn hefyd yn cael ei gadarnhau gan nodweddion swyddogol yr A100 yn y fersiwn SXM3, a gyhoeddwyd heddiw.

Wrth ymyl y GPUs A100 ar y famfwrdd mae chwe switsh rhyngwyneb NVLink trydydd cenhedlaeth, sydd gyda'i gilydd yn darparu cyfnewid data dwy ffordd ar gyflymder o 4,8 TB / s. Cymerodd NVIDIA ofal difrifol hefyd o'u hoeri, a barnu yn ôl y rheiddiaduron proffil llawn gyda phibellau gwres. Dyrennir 12 sianel o ryngwyneb NVLink i bob GPU; gall GPUs cyfagos gyfnewid data ar gyflymder o 600 GB / s.

Mae system DGX A100 hefyd yn gartref i naw rheolydd rhwydwaith HDR Mellanox ConnectX-6, sy'n gallu trosglwyddo gwybodaeth ar gyflymder hyd at 200 Gbit yr eiliad. Yn gyfan gwbl, mae'r DGX A100 yn darparu trosglwyddiad data dwy ffordd ar gyflymder o 3,6 TB yr eiliad. Mae'r system hefyd yn defnyddio technolegau Mellanox perchnogol gyda'r nod o raddio systemau cyfrifiadurol yn effeithlon gyda phensaernïaeth o'r fath. Mae cefnogaeth PCI Express 4.0 ar lefel y platfform yn cael ei bennu gan broseswyr cenhedlaeth AMD EPYC Rome; o ganlyniad, mae'r rhyngwyneb hwn yn cael ei ddefnyddio nid yn unig gan gyflymwyr graffeg A100, ond hefyd gan yriannau cyflwr solet gyda'r protocol NVMe.

NVIDIA DGX A100: mae platfform cyntaf wedi'i seilio ar Ampere yn cynnig pum petaflop o berfformiad

Yn ogystal â'r DGX A100, mae NVIDIA wedi dechrau cyflenwi byrddau HGX A100 i'w bartneriaid, sef un o gydrannau systemau gweinyddwyr y bydd gweithgynhyrchwyr eraill yn eu cynhyrchu ar eu pen eu hunain. Gall un bwrdd HGX A100 gynnwys naill ai pedwar neu wyth GPU NVIDIA A100. Yn ogystal, ar gyfer ei anghenion ei hun, mae NVIDIA eisoes wedi ymgynnull DGX SuperPOD - clwstwr o systemau 140 DGX A100, gan ddarparu perfformiad ar 700 petaflops gyda dimensiynau cyffredinol eithaf cymedrol. Addawodd y cwmni ddarparu cymorth methodolegol i bartneriaid sy'n dymuno adeiladu clystyrau cyfrifiadurol tebyg yn seiliedig ar yr DGX A100. Gyda llaw, ni chymerodd NVIDIA fwy na mis i adeiladu'r DGX SuperPOD yn lle sawl mis neu hyd yn oed flynyddoedd sy'n nodweddiadol ar gyfer tasgau o'r fath.

NVIDIA DGX A100: mae platfform cyntaf wedi'i seilio ar Ampere yn cynnig pum petaflop o berfformiad

Yn ôl NVIDIA, mae danfoniadau DGX A100 eisoes wedi dechrau am bris o $199 y copi, mae partneriaid y cwmni eisoes yn cynnal y systemau hyn yn eu clystyrau cwmwl, mae'r ecosystem eisoes yn cwmpasu 000 o wledydd, gan gynnwys Fietnam a'r Emiradau Arabaidd Unedig. Yn ogystal, mae'n eithaf rhagweladwy y bydd datrysiadau graffeg gyda phensaernïaeth Ampere yn rhan o system uwchgyfrifiadur Perlmutter, a grëwyd gan Cray ar gyfer Adran Ynni'r UD. Bydd yn cynnwys proseswyr graffeg NVIDIA Ampere ochr yn ochr â phroseswyr canolog cenhedlaeth AMD EPYC Milan gyda phensaernïaeth Zen 26. Bydd nodau uwchgyfrifiadur yn seiliedig ar NVIDIA Ampere yn cyrraedd y cwsmer yn ail hanner y flwyddyn, er bod y copïau cyntaf eisoes wedi cyrraedd y labordy arbenigol o yr adran Americanaidd.



Ffynhonnell: 3dnewyddion.ru

Ychwanegu sylw