🥇NVIDIA DGX A100. Ամպերի վրա հիմնված դեբյուտային պլատֆորմն առաջարկում է հինգ պետաֆլոպ կատարողականություն

DGX A100 համակարգը, որի հիման վրա վերջերս Jen-Hsun Huang այն հանեց ջեռոցից, ներառում է ութ A100 GPU, վեց NVLink 3.0 անջատիչներ, Mellanox ցանցի ինը կարգավորիչներ, երկու AMD EPYC Rome սերնդի պրոցեսոր՝ 64 միջուկով, 1 ՏԲ օպերատիվ հիշողություն և 15 ՏԲ SSD՝ NVMe աջակցությամբ։

NVIDIA DGX A100-ը ընկերության հաշվողական համակարգերի երրորդ սերունդն է, որը նախատեսված է հիմնականում արհեստական ինտելեկտի խնդիրների լուծման համար: Այժմ նման համակարգերը կառուցված են Ampere ընտանիքի վերջին A100 գրաֆիկական պրոցեսորների վրա, ինչը հանգեցնում է դրանց կատարողականի կտրուկ աճի, որը հասել է 5 պետաֆլոպսի։ Դրա շնորհիվ DGX A100-ն ի վիճակի է կառավարել AI-ի շատ ավելի բարդ մոդելներ և տվյալների շատ ավելի մեծ ծավալներ:

DGX A100 համակարգի համար NVIDIA-ն ցույց է տալիս միայն HBM2 հիշողության ընդհանուր ծավալը, որը հասնում է 320 ԳԲ-ի: Պարզ թվաբանական հաշվարկները թույլ են տալիս որոշել, որ յուրաքանչյուր GPU-ն ունի 40 ԳԲ հիշողություն, և նոր արտադրանքի պատկերները պարզ են դարձնում, որ այս ծավալը բաշխված է վեց կույտերի միջև: Նշվում է նաև գրաֆիկական հիշողության թողունակությունը՝ 12,4 ՏԲ/վ՝ ընդհանուր DGX A100 համակարգի համար։

Հաշվի առնելով, որ DGX-1 համակարգը, որը հիմնված է ութ Tesla V100-ների վրա, արտադրել է մեկ պետաֆլոպ խառը ճշգրիտ հաշվարկներով, իսկ DGX A100-ը, ինչպես պնդում են, աշխատում է հինգ պետաֆլոպսով, մենք կարող ենք ենթադրել, որ կոնկրետ հաշվարկներում մեկ Ampere GPU-ն հինգ անգամ ավելի արագ է, քան նրա նախորդը Volta ճարտարապետությամբ: Որոշ դեպքերում առավելությունը դառնում է քսանապատիկ։

Ընդհանուր առմամբ, DGX A8 համակարգը ապահովում է առավելագույն կատարողականություն՝ վայրկյանում 100 գործողություն ամբողջ թվով գործողություններում (INT1016), կիսաճշգրիտ լողացող կետի գործողություններում (FP16)՝ 5 պետաֆլոպս, կրկնակի ճշգրտությամբ լողացող կետի գործողություններում (FP64)՝ 156 տերաֆլոպս։ . Բացի այդ, DGX A32-ը հասնում է 100 պետաֆլոպսի առավելագույն կատարողականի TF2,5 թենզորային հաշվարկում: Հիշենք, որ մեկ տերաֆլոպսը վայրկյանում 1012 լողացող կետով գործողություն է, մեկ պետաֆլոպսը վայրկյանում 1015 լողացող կետի գործողություն է:

NVIDIA A100 արագացուցիչների կարևոր հատկանիշը մեկ GPU-ի ռեսուրսները յոթ վիրտուալ հատվածների բաժանելու հնարավորությունն է: Սա թույլ է տալիս զգալիորեն մեծացնել կազմաձևման ճկունությունը նույն ամպային հատվածում: Օրինակ, մեկ DGX A100 համակարգը ութ ֆիզիկական GPU-ով կարող է գործել որպես 56 վիրտուալ GPU: Multi-Instance GPU (MIG) տեխնոլոգիան թույլ է տալիս ընտրել տարբեր չափերի հատվածներ ինչպես հաշվողական միջուկներից, այնպես էլ որպես քեշի հիշողության և HBM2 հիշողության մաս, և դրանք չեն մրցի միմյանց հետ թողունակության համար:

Հարկ է նշել, որ նախորդ DGX համակարգերի համեմատ, DGX A100-ի անատոմիան որոշակի փոփոխություններ է կրել։ SXM3 մոդուլների ռադիատորներում ջերմային խողովակների քանակը, որոնց վրա տեղադրված են A100 գրաֆիկական պրոցեսորներ HBM2 հիշողությամբ, զգալիորեն ավելացել է Volta սերնդի Tesla V100 մոդուլների համեմատ, չնայած դրանց ծայրերը թաքնված են սովորական մարդու տեսադաշտից: վերին ծածկոցներով։ Այս դիզայնի գործնական սահմանը 400 Վտ ջերմային էներգիա է: Դա հաստատում են նաև այսօր հրապարակված SXM100 տարբերակում A3-ի պաշտոնական բնութագրերը։

Մայր տախտակի վրա A100 GPU-ների կողքին կան երրորդ սերնդի NVLink ինտերֆեյսի վեց անջատիչներ, որոնք միասին ապահովում են տվյալների երկկողմանի փոխանակում 4,8 ՏԲ/վ արագությամբ: NVIDIA-ն նույնպես լուրջ հոգացել է դրանց հովացման մասին՝ դատելով ջերմային խողովակներով լի պրոֆիլային ռադիատորներից։ Յուրաքանչյուր GPU-ին հատկացված է NVLink ինտերֆեյսի 12 ալիք, հարևան GPU-ները կարող են տվյալներ փոխանակել 600 ԳԲ/վ արագությամբ:

DGX A100 համակարգում կա նաև Mellanox ConnectX-6 HDR ցանցի ինը կարգավորիչներ, որոնք կարող են տեղեկատվություն փոխանցել մինչև 200 Գբիտ/վ արագությամբ: Ընդհանուր առմամբ, DGX A100-ն ապահովում է տվյալների երկկողմանի փոխանցում 3,6 ՏԲ/վ արագությամբ: Համակարգը նաև օգտագործում է սեփական Mellanox տեխնոլոգիաներ, որոնք ուղղված են նման ճարտարապետությամբ հաշվողական համակարգերի արդյունավետ մասշտաբավորմանը: PCI Express 4.0-ի աջակցությունը պլատֆորմի մակարդակում որոշվում է AMD EPYC Rome սերնդի պրոցեսորներով, արդյունքում այս ինտերֆեյսը օգտագործվում է ոչ միայն A100 գրաֆիկական արագացուցիչների կողմից, այլև NVMe արձանագրությամբ պինդ վիճակի կրիչների կողմից:

Բացի DGX A100-ից, NVIDIA-ն սկսել է իր գործընկերներին մատակարարել HGX A100 տախտակներ, որոնք սերվերային համակարգերի բաղադրիչներից են, որոնք այլ արտադրողներն ինքնուրույն կարտադրեն: Մեկ HGX A100 տախտակ կարող է տեղավորել չորս կամ ութ NVIDIA A100 GPU: Բացի այդ, իր կարիքների համար NVIDIA-ն արդեն հավաքել է DGX SuperPOD՝ 140 DGX A100 համակարգերից բաղկացած կլաստեր, որն ապահովում է արդյունավետություն 700 պետաֆլոպսում՝ բավականին համեստ ընդհանուր չափսերով: Ընկերությունը խոստացել է մեթոդական օգնություն տրամադրել գործընկերներին, ովքեր ցանկանում են DGX A100-ի հիման վրա նմանատիպ հաշվողական կլաստերներ կառուցել: Ի դեպ, NVIDIA-ից ոչ ավելի, քան մեկ ամիս պահանջվեց DGX SuperPOD-ի ստեղծման համար՝ նման առաջադրանքների համար բնորոշ մի քանի ամիսների կամ նույնիսկ տարիների փոխարեն։

Ըստ NVIDIA-ի՝ DGX A100-ի առաքումն արդեն սկսվել է մեկ օրինակի համար 199 դոլար արժողությամբ, ընկերության գործընկերներն արդեն հյուրընկալում են այդ համակարգերն իրենց ամպային կլաստերներում, էկոհամակարգն արդեն ընդգրկում է 000 երկիր, այդ թվում՝ Վիետնամը և ԱՄԷ-ն: Բացի այդ, Ampere ճարտարապետությամբ գրաֆիկական լուծումները միանգամայն կանխատեսելիորեն կկազմեն Perlmutter գերհամակարգչային համակարգի մի մասը, որը ստեղծվել է Cray-ի կողմից ԱՄՆ էներգետիկայի նախարարության համար: Այն բաղկացած կլինի NVIDIA Ampere գրաֆիկական պրոցեսորներից և AMD EPYC Milan սերնդի կենտրոնական պրոցեսորներից՝ Zen 26 ճարտարապետությամբ: NVIDIA Ampere-ի վրա հիմնված գերհամակարգչային հանգույցները հաճախորդին կհասնեն տարվա երկրորդ կեսին, թեև առաջին օրինակներն արդեն հասել են մասնագիտացված լաբորատորիա: ամերիկյան վարչությունը։

Source: 3dnews.ru

NVIDIA DGX A100. Ամպերի վրա հիմնված դեբյուտային պլատֆորմն առաջարկում է հինգ ֆետաֆլոպ կատարողականություն

ProHoster