NVIDIA DGX A100: дебютна платформа на базі Ampere запропонувала п'ять петафлопс швидкодії

До складу системи DGX A100, основу якої Дженсен Хуанг (Jen-Hsun Huang) днями виймав із духовки, Входять вісім графічних процесорів A100, шість комутаторів NVLink 3.0, дев'ять мережевих контролерів Mellanox, два процесори AMD EPYC покоління Rome з 64 ядрами, 1 Тбайт оперативної пам'яті та 15 Тбайт твердотільних накопичувачів з підтримкою NVM.

NVIDIA DGX A100: дебютна платформа на базі Ampere запропонувала п'ять петафлопс швидкодії

NVIDIA DGX A100 - це третє покоління обчислювальних систем компанії, призначених насамперед для вирішення задач штучного інтелекту. Тепер такі системи будуються на найсучасніших графічних процесорах A100 сімейства Ampere, що зумовлює різке зростання їхньої продуктивності, яка досягла 5 петафлопс. Завдяки цьому DGX A100 здатна забезпечити роботу зі значно більш складними моделями ІІ та зі значно більшими обсягами даних.

Для системи DGX A100 компанія NVIDIA вказує лише сукупний обсяг пам'яті типу HBM2, що сягає 320 Гбайт. Нехитрі арифметичні обчислення дозволяють визначити, що на кожен графічний процесор припадає по 40 Гбайт пам'яті, а зображення новинки дозволяють однозначно судити, що цей обсяг розподілений між шістьма стеками. Згадується і пропускна спроможність графічної пам'яті - 12,4 Тбайт/с для системи DGX A100 в сукупності.

Якщо врахувати, що система DGX-1 на базі восьми Tesla V100 видавала один петафлопс у обчисленнях змішаної точності, а для DGX A100 заявлена ​​швидкодія на рівні п'яти петафлопс, можна припустити, що в специфічних обчисленнях один графічний процесор Ampere у п'ять разів швидше архітектурою Volta. В окремих випадках перевага стає двадцятикратною.

NVIDIA DGX A100: дебютна платформа на базі Ampere запропонувала п'ять петафлопс швидкодії

Загалом, в цілих операціях (INT8) система DGX A100 забезпечує пікову швидкодію на рівні 1016 операцій в секунду, в операціях з плаваючою комою половинної точності (FP16) - 5 петафлопс, в операціях подвійної точності (FP64) - 156 терафлопс. Крім того, у тензорних обчисленнях TF32 пікова швидкодія DGX A100 досягає 2,5 петафлопс. Нагадаємо, один терафлопс - це 1012 операцій з плаваючою комою на секунду, один петафлопс - 1015 операцій з плаваючою комою на секунду.

Важливою особливістю прискорювачів NVIDIA A100 є здатність розділяти ресурси одного графічного процесора на сім віртуальних сегментів. Це дозволяє значно підвищити гнучкість конфігурування у тому самому хмарному сегменті. Наприклад, одна система DGX A100 з вісьмома фізичними графічними процесорами може виступати як 56 віртуальних графічних процесорів. Технологія Multi-Instance GPU (MIG) дозволяє виділити сегменти різної величини як серед обчислювальних ядер, так і в складі кеш-пам'яті та пам'яті типу HBM2, причому вони не змагатимуться один з одним за пропускну здатність.

NVIDIA DGX A100: дебютна платформа на базі Ampere запропонувала п'ять петафлопс швидкодії

Варто зауважити, що в порівнянні з минулими системами DGX анатомія DGX A100 зазнала деяких змін. Кількість теплових трубок у радіаторах модулів SXM3, на які встановлені графічні процесори A100 з пам'яттю HBM2, значно збільшилася в порівнянні з модулями Tesla V100 покоління Volta, хоча їхні кінці і приховані від обивача верхніми накладками. Практична межа для такого конструктивного виконання – це 400 Вт теплової енергії. Це підтверджується і офіційними характеристиками A100 у виконанні SXM3, опублікованими сьогодні.

Поруч із графічними процесорами A100 на материнській платі розмістилися шість комутаторів інтерфейсу NVLink третього покоління, які разом забезпечують двосторонній обмін даними зі швидкістю 4,8 Тбайт/с. Про їхнє охолодження NVIDIA теж серйозно подбала, якщо судити з повнопрофільних радіаторів із тепловими трубками. На кожен графічний процесор виділено по 12 каналів інтерфейсу NVLink, сусідні графічні процесори можуть обмінюватись даними зі швидкістю 600 Гбайт/с.

Система DGX A100 розмістила дев'ять мережевих контролерів Mellanox ConnectX-6 HDR, здатних передавати інформацію зі швидкістю до 200 Гбіт/с. Спільно, DGX A100 забезпечує двосторонній обмін даними зі швидкістю 3,6 Тбайт/с. Система також використовує фірмові технології Mellanox, спрямовані на ефективне масштабування обчислювальних систем із такою архітектурою. Підтримку PCI Express 4.0 на рівні платформи визначають процесори AMD EPYC покоління Rome, в результаті цей інтерфейс використовується не тільки графічними прискорювачами A100, але і накопичувачами твердотілими з протоколом NVMe.

NVIDIA DGX A100: дебютна платформа на базі Ampere запропонувала п'ять петафлопс швидкодії

Крім DGX A100, компанія NVIDIA почала постачати своїх партнерів платами HGX A100, які є одним із компонентів серверних систем, які інші виробники випускатимуть самостійно. На одній платі HGX A100 може бути або чотири, або вісім графічних процесорів NVIDIA A100. Крім того, для власних потреб NVIDIA вже зібрала DGX SuperPOD - кластер із 140 систем DGX A100, що забезпечує швидкодію на рівні 700 петафлопс за досить скромних габаритних розмірів. Компанія пообіцяла надавати методологічну допомогу партнерам, які бажають побудувати схожі обчислювальні кластери на базі DGX A100. До речі, на будівництво DGX SuperPOD у NVIDIA пішло не більше місяця замість типових для подібних завдань кількох місяців або навіть років.

NVIDIA DGX A100: дебютна платформа на базі Ampere запропонувала п'ять петафлопс швидкодії

За словами NVIDIA, постачання DGX A100 вже розпочалося за ціною $199 000 за екземпляр, партнери компанії вже розміщують ці системи у своїх хмарних кластерах, екосистема вже охоплює 26 країн, серед яких згадуються В'єтнам та ОАЕ. Крім того, графічні рішення з архітектурою Ampere цілком передбачувано увійдуть до складу суперкомп'ютерної системи Perlmutter, яку створює Cray на замовлення Міністерства енергетики США. У її складі графічні процесори NVIDIA Ampere будуть сусідити з центральними процесорами AMD EPYC покоління Milan з архітектурою Zen 3. Вузли суперкомп'ютера на основі NVIDIA Ampere дістануться замовника у другому півріччі, хоча перші екземпляри вже надійшли до профільної лабораторії американського.



Джерело: 3dnews.ru

Додати коментар або відгук