НВИДИА ДГКС А100: дебитантска платформа заснована на Амперу нуди пет петафлопса перформанси

Систем ДГКС А100, на основу којег је Јен-Хсун Хуанг недавно извадио из рерне, укључује осам А100 ГПУ-а, шест НВЛинк 3.0 прекидача, девет Мелланок мрежних контролера, два процесора АМД ЕПИЦ Роме генерације са 64 језгра, 1 ТБ РАМ-а и 15 ТБ ССД-ова са подршком за НВМе.

НВИДИА ДГКС А100: дебитантска платформа заснована на Амперу нуди пет петафлопса перформанси

НВИДИА ДГКС А100 је трећа генерација рачунарских система компаније, дизајнираних првенствено за решавање проблема вештачке интелигенције. Сада су такви системи изграђени на најновијим графичким процесорима А100 из породице Ампере, што узрокује нагло повећање њихових перформанси, које су достигле 5 петафлопса. Захваљујући томе, ДГКС А100 је у стању да обрађује много сложеније АИ моделе и много веће количине података.

За систем ДГКС А100, НВИДИА означава само укупну количину ХБМ2 меморије, која достиже 320 ГБ. Једноставна аритметичка израчунавања нам омогућавају да утврдимо да сваки ГПУ има 40 ГБ меморије, а слике новог производа јасно показују да је овај волумен распоређен на шест стекова. Помиње се и пропусни опсег графичке меморије – 12,4 ТБ/с за цео систем ДГКС А100 укупно.

Узимајући у обзир да је систем ДГКС-1, заснован на осам Тесла В100, произвео један петафлопс у прорачунима мешовите прецизности, а за ДГКС А100 се тврди да ради на пет петафлопса, можемо претпоставити да је у специфичним прорачунима један Ампер ГПУ пет пута бржи од његов претходник са архитектуром Волта. У неким случајевима, предност постаје двадесетострука.

НВИДИА ДГКС А100: дебитантска платформа заснована на Амперу нуди пет петафлопса перформанси

Укупно, ДГКС А8 систем обезбеђује врхунске перформансе од 100 операција у секунди у целобројним операцијама (ИНТ1016), у операцијама са помичним зарезом (ФП16) - 5 петафлопса, у операцијама са помичним зарезом двоструке прецизности (ФП64) - 156 терафлопса . Поред тога, ДГКС А32 постиже врхунске перформансе од 100 петафлопса у ТФ2,5 тензорском рачунарству. Подсетимо се да је један терафлопс 1012 операција с помичним зарезом у секунди, један петафлопс је 1015 операција с помичним зарезом у секунди.

Важна карактеристика НВИДИА А100 акцелератора је могућност поделе ресурса једног ГПУ-а на седам виртуелних сегмената. Ово вам омогућава да значајно повећате флексибилност конфигурације у истом сегменту облака. На пример, један ДГКС А100 систем са осам физичких ГПУ-а може да делује као 56 виртуелних ГПУ-а. Мулти-Инстанце ГПУ (МИГ) технологија вам омогућава да изаберете сегменте различитих величина како међу рачунарским језграма тако и као део кеш меморије и ХБМ2 меморије, и они се неће такмичити једни са другима за пропусни опсег.

НВИДИА ДГКС А100: дебитантска платформа заснована на Амперу нуди пет петафлопса перформанси

Вреди напоменути да је у поређењу са претходним ДГКС системима, анатомија ДГКС А100 претрпела неке промене. Број топлотних цеви у радијаторима модула СКСМ3, на које су уграђени графички процесори А100 са ХБМ2 меморијом, значајно је повећан у односу на Тесла В100 модуле Волта генерације, иако су њихови крајеви скривени од погледа просечног човека. уз горње корице. Практична граница за овај дизајн је 400 В топлотне енергије. То потврђују и званичне карактеристике А100 у верзији СКСМ3, објављене данас.

Поред А100 ГПУ-а на матичној плочи налази се шест НВЛинк интерфејс прекидача треће генерације, који заједно обезбеђују двосмерну размену података брзином од 4,8 ТБ/с. НВИДИА се такође озбиљно побринула за њихово хлађење, судећи по радијаторима пуног профила са топлотним цевима. Сваком ГПУ-у је додељено 12 канала НВЛинк интерфејса; суседни ГПУ-ови могу да размењују податке брзином од 600 ГБ/с.

ДГКС А100 систем такође садржи девет Мелланок ЦоннецтКс-6 ХДР мрежних контролера, способних за пренос информација брзинама до 200 Гбит/с. Укупно, ДГКС А100 обезбеђује двосмерни пренос података брзином од 3,6 ТБ/с. Систем такође користи власничке Мелланок технологије које имају за циљ ефикасно скалирање рачунарских система са таквом архитектуром. Подршку за ПЦИ Екпресс 4.0 на нивоу платформе одређују процесори генерације АМД ЕПИЦ Роме; као резултат, овај интерфејс користе не само А100 графички акцелератори, већ и ССД уређаји са НВМе протоколом.

НВИДИА ДГКС А100: дебитантска платформа заснована на Амперу нуди пет петафлопса перформанси

Поред ДГКС А100, НВИДИА је почела да снабдева своје партнере и ХГКС А100 плочама, које су једна од компоненти серверских система које ће други произвођачи сами производити. Једна ХГКС А100 плоча може да прими четири или осам НВИДИА А100 ГПУ-а. Поред тога, за сопствене потребе, НВИДИА је већ саставила ДГКС СуперПОД – кластер од 140 ДГКС А100 система, који пружају перформансе од 700 петафлопса са прилично скромним укупним димензијама. Компанија је обећала да ће пружити методолошку помоћ партнерима који желе да изграде сличне рачунарске кластере засноване на ДГКС А100. Иначе, НВИДИА-и није требало више од месец дана да направи ДГКС СуперПОД уместо неколико месеци или чак година типичних за такве задатке.

НВИДИА ДГКС А100: дебитантска платформа заснована на Амперу нуди пет петафлопса перформанси

Према НВИДИА-и, испоруке ДГКС А100 су већ почеле по цени од 199 долара по копији, партнери компаније већ хостују ове системе у својим кластерима, екосистем већ покрива 000 земаља, укључујући Вијетнам и УАЕ. Поред тога, графичка решења са Ампере архитектуром ће сасвим предвидљиво бити део Перлмуттеровог суперкомпјутерског система, који је креирао Цраи за Министарство енергетике САД. Састојиће се од графичких процесора НВИДИА Ампере уз централне процесоре генерације АМД ЕПИЦ Милан са архитектуром Зен 26. Суперкомпјутерски чворови засновани на НВИДИА Ампере ће стићи до купаца у другој половини године, иако су прве копије већ стигле у специјализовану лабораторију америчко одељење.



Извор: 3дневс.ру

Додај коментар