NVIDIA DGX A100: дебитантската платформа базирана на Ampere нуди пет петафлопи перформанси

Системот DGX A100, врз основа на кој Jen-Hsun Huang неодамна го извади од рерната, вклучува осум A100 графички процесори, шест NVLink 3.0 прекинувачи, девет Mellanox мрежни контролери, два процесори од генерацијата AMD EPYC Rome со 64 јадра, 1 TB RAM и 15 TB SSD дискови со NVMe поддршка.

NVIDIA DGX A100: дебитантската платформа базирана на Ampere нуди пет петафлопи перформанси

NVIDIA DGX A100 е третата генерација на компјутерските системи на компанијата, дизајнирани првенствено за решавање на проблеми со вештачка интелигенција. Сега ваквите системи се изградени на најновите графички процесори A100 од семејството Ampere, што предизвикува нагло зголемување на нивните перформанси, кои достигнаа 5 петафлопи. Благодарение на ова, DGX A100 може да се справи со многу посложени модели со вештачка интелигенција и многу поголем обем на податоци.

За системот DGX A100, NVIDIA ја означува само вкупната количина на HBM2 меморија, која достигнува 320 GB. Едноставните аритметички пресметки ни овозможуваат да утврдиме дека секој графички процесор има 40 GB меморија, а сликите од новиот производ јасно покажуваат дека овој волумен е распределен меѓу шест купови. Се споменува и пропусниот опсег на графичката меморија - 12,4 TB / s за целиот систем DGX A100 вкупно.

Имајќи предвид дека системот DGX-1, базиран на осум Tesla V100, произведе еден петафлоп во пресметки со мешана прецизност, а се тврди дека DGX A100 работи со пет петафлопи, можеме да претпоставиме дека во конкретни пресметки еден Ampere GPU е пет пати побрз од неговиот претходник со архитектурата Волта. Во некои случаи, предноста станува дваесеткратна.

NVIDIA DGX A100: дебитантската платформа базирана на Ampere нуди пет петафлопи перформанси

Севкупно, системот DGX A8 обезбедува врвни перформанси од 100 операции во секунда во операции со цел број (INT1016), во полупрецизни операции со подвижна запирка (FP16) - 5 петафлопи, во операции со подвижна запирка со двојна прецизност (FP64) - 156 терафлопи . Дополнително, DGX A32 постигнува врвни перформанси од 100 петафлопи во пресметувањето на тензорите TF2,5. Да потсетиме дека еден терафлоп е 1012 операции со подвижна запирка во секунда, еден петафлоп е 1015 операции со подвижна запирка во секунда.

Важна карактеристика на акцелераторите NVIDIA A100 е способноста да се поделат ресурсите на еден графички процесор на седум виртуелни сегменти. Ова ви овозможува значително да ја зголемите флексибилноста на конфигурацијата во истиот сегмент на облак. На пример, еден систем DGX A100 со осум физички графички процесори може да дејствува како 56 виртуелни графички процесори. Технологијата со повеќе инстанци GPU (MIG) ви овозможува да изберете сегменти со различни големини и меѓу компјутерските јадра и како дел од кеш меморијата и меморијата HBM2, а тие нема да се натпреваруваат едни со други за пропусниот опсег.

NVIDIA DGX A100: дебитантската платформа базирана на Ampere нуди пет петафлопи перформанси

Вреди да се напомене дека во споредба со претходните системи DGX, анатомијата на DGX A100 претрпе одредени промени. Бројот на топлински цевки во радијаторите на модулите SXM3, на кои се инсталирани графички процесори A100 со HBM2 меморија, е значително зголемен во споредба со модулите Tesla V100 од генерацијата Volta, иако нивните краеви се скриени од погледот на просечниот човек од страна на горните корици. Практичната граница за овој дизајн е 400 W топлинска енергија. Тоа го потврдуваат и официјалните карактеристики на A100 во верзијата SXM3, објавени денеска.

До A100 графичките процесори на матичната плоча се наоѓаат шест интерфејс прекинувачи NVLink од третата генерација, кои заедно обезбедуваат двонасочна размена на податоци со брзина од 4,8 TB/s. NVIDIA сериозно се погрижи и за нивното ладење, судејќи според целосните радијатори со топлински цевки. На секој графички процесор му се доделуваат 12 канали од интерфејсот NVLink; соседните графички процесори можат да разменуваат податоци со брзина од 600 GB/s.

Системот DGX A100 содржи и девет мрежни контролери Mellanox ConnectX-6 HDR, способни да пренесуваат информации со брзина до 200 Gbit/s. Севкупно, DGX A100 обезбедува двонасочен пренос на податоци со брзина од 3,6 TB/s. Системот користи и сопственички технологии Mellanox насочени кон ефикасно скалирање на компјутерските системи со таква архитектура. Поддршката за PCI Express 4.0 на ниво на платформа е одредена од процесорите од генерацијата AMD EPYC Rome; како резултат на тоа, овој интерфејс се користи не само од графичките акцелератори A100, туку и од погоните со цврста состојба со протоколот NVMe.

NVIDIA DGX A100: дебитантската платформа базирана на Ampere нуди пет петафлопи перформанси

Покрај DGX A100, NVIDIA почна да ги снабдува своите партнери со HGX A100 плочи, кои се една од компонентите на серверските системи што другите производители ќе ги произведуваат сами. Една плочка HGX A100 може да прими четири или осум графички процесори NVIDIA A100. Покрај тоа, за свои потреби, NVIDIA веќе го состави DGX SuperPOD - кластер од 140 системи DGX A100, обезбедувајќи перформанси на 700 петафлопи со прилично скромни вкупни димензии. Компанијата вети дека ќе обезбеди методолошка помош на партнерите кои сакаат да изградат слични компјутерски кластери базирани на DGX A100. Патем, на NVIDIA и требаше не повеќе од еден месец да го изгради DGX SuperPOD наместо неколку месеци или дури години типични за такви задачи.

NVIDIA DGX A100: дебитантската платформа базирана на Ampere нуди пет петафлопи перформанси

Според NVIDIA, испораките на DGX A100 веќе започнаа по цена од 199 долари по примерок, партнерите на компанијата веќе ги хостираат овие системи во нивните облак кластери, екосистемот веќе покрива 000 земји, вклучувајќи ги Виетнам и ОАЕ. Дополнително, графичките решенија со Ampere архитектура сосема очекувано ќе бидат дел од суперкомпјутерскиот систем Perlmutter, создаден од Cray за Министерството за енергетика на САД. Ќе се состои од графички процесори NVIDIA Ampere заедно со централните процесори од генерацијата AMD EPYC Milan со Zen 26 архитектура. американскиот оддел.



Извор: 3dnews.ru

Додадете коментар