NVIDIA DGX A100- ပွဲဦးထွက် Ampere-based ပလပ်ဖောင်းသည် စွမ်းဆောင်ရည်ငါးခုကို ပေးစွမ်းသည်။

မကြာသေးမီက Jen-Hsun Huang ကိုအခြေခံထားသော DGX A100 စနစ် မီးဖိုထဲက ယူသွားတယ်။၎င်းတွင် A100 GPU ရှစ်ခု၊ NVLink 3.0 ခလုတ်ခြောက်ခု၊ Mellanox ကွန်ရက်ထိန်းချုပ်သူ ကိုးခု၊ 64 cores ရှိသော AMD EPYC Rome-မျိုးဆက်ပရိုဆက်ဆာနှစ်ခု၊ RAM 1 TB နှင့် NVMe ပံ့ပိုးမှုရှိသော 15 TB SSD များ ပါဝင်သည်။

NVIDIA DGX A100- ပွဲဦးထွက် Ampere-based ပလပ်ဖောင်းသည် စွမ်းဆောင်ရည်ငါးခုကို ပေးစွမ်းသည်။

NVIDIA DGX A100 သည် ဉာဏ်ရည်တုဆိုင်ရာ ပြဿနာများကို ဖြေရှင်းရန်အတွက် အဓိက ဒီဇိုင်းထုတ်ထားသည့် ကုမ္ပဏီ၏ ကွန်ပျူတာစနစ်များ၏ တတိယမျိုးဆက်ဖြစ်သည်။ ယခုအခါ အဆိုပါစနစ်များကို Ampere မိသားစုမှ နောက်ဆုံးထွက် A100 ဂရပ်ဖစ်ပရိုဆက်ဆာများပေါ်တွင် တည်ဆောက်ထားပြီး 5 petaflops အထိ ၎င်းတို့၏စွမ်းဆောင်ရည်ကို သိသိသာသာ တိုးမြင့်လာစေပါသည်။ ယင်းကြောင့် DGX A100 သည် ပိုမိုရှုပ်ထွေးသော AI မော်ဒယ်များနှင့် ဒေတာပမာဏများစွာကို ကိုင်တွယ်ဖြေရှင်းနိုင်မည်ဖြစ်သည်။

DGX A100 စနစ်အတွက်၊ NVIDIA သည် 2 GB အထိရှိသည့် HBM320 memory စုစုပေါင်းပမာဏကိုသာ ဖော်ပြသည်။ ရိုးရှင်းသောဂဏန်းသင်္ချာတွက်ချက်မှုများသည် GPU တစ်ခုစီတွင် 40 GB မမ်မိုရီရှိကြောင်း ဆုံးဖြတ်နိုင်စေပြီး ထုတ်ကုန်အသစ်၏ပုံများသည် ဤပမာဏကို အတွဲခြောက်ခုကြားတွင် ဖြန့်ဝေထားကြောင်း ရှင်းလင်းစေသည်။ ဂရပ်ဖစ် memory bandwidth ကိုလည်း DGX A12,4 စနစ်တစ်ခုလုံးအတွက် စုစုပေါင်း 100 TB/s ရှိသည်။

Tesla V1s ရှစ်ခုကို အခြေခံ၍ DGX-100 စနစ်သည် ရောစပ်တိကျသော တွက်ချက်မှုများတွင် petaflops တစ်ခုကို ထုတ်လုပ်ခဲ့ပြီး DGX A100 သည် petaflops ငါးခုတွင် လုပ်ဆောင်ရန် တောင်းဆိုထားသည်ကို ထည့်သွင်းစဉ်းစားခြင်းဖြင့် တိကျသောတွက်ချက်မှုတွင် Ampere GPU တစ်ခုသည် ငါးဆပိုမိုမြန်ဆန်သည်ဟု ကျွန်ုပ်တို့ ယူဆနိုင်သည်။ Volta ဗိသုကာလက်ရာဖြင့် ၎င်း၏ရှေ့ဆက်သူဖြစ်သည်။ အချို့ကိစ္စများတွင် အားသာချက်သည် အဆနှစ်ဆယ်ဖြစ်လာသည်။

NVIDIA DGX A100- ပွဲဦးထွက် Ampere-based ပလပ်ဖောင်းသည် စွမ်းဆောင်ရည်ငါးခုကို ပေးစွမ်းသည်။

စုစုပေါင်း၊ DGX A8 စနစ်သည် ကိန်းပြည့်လည်ပတ်မှုများ (INT100) တွင် တစ်စက္ကန့်လျှင် 1016 လည်ပတ်မှု အထွတ်အထိပ် စွမ်းဆောင်ရည် (INT16)၊ ထက်ဝက်တိကျသော floating point လည်ပတ်မှုများ (FP5) - 64 petaflops၊ နှစ်ထပ်-တိကျသော floating point လည်ပတ်မှု (FP156) - 32 teraflops . ထို့အပြင်၊ DGX A100 သည် TF2,5 tensor computing တွင် 1012 petaflops ၏ အထွတ်အထိပ်စွမ်းဆောင်ရည်ကို ရရှိသည်။ teraflops တစ်ခုသည် တစ်စက္ကန့်လျှင် 1015 floating point operations ဖြစ်ပြီး၊ petaflops တစ်ခုသည် တစ်စက္ကန့်လျှင် XNUMX floating point operations ဖြစ်သည်ကို သတိရကြပါစို့။

NVIDIA A100 accelerators ၏အရေးကြီးသောအင်္ဂါရပ်မှာ GPU တစ်ခု၏အရင်းအမြစ်များကို virtual segments ခုနစ်ခုသို့ခွဲထုတ်နိုင်စွမ်းဖြစ်သည်။ ၎င်းသည် တူညီသော cloud အပိုင်းတွင် configuration flexibility ကို သိသာစွာ တိုးမြှင့်နိုင်စေပါသည်။ ဥပမာအားဖြင့်၊ ရုပ်ပိုင်းဆိုင်ရာ GPU ရှစ်ခုပါသော DGX A100 စနစ်တစ်ခုသည် 56 virtual GPUs အဖြစ် လုပ်ဆောင်နိုင်သည်။ Multi-Instance GPU (MIG) နည်းပညာသည် သင့်အား ကွန်ပျူတာ cores များကြားတွင်ရော cache memory နှင့် HBM2 memory ၏ တစ်စိတ်တစ်ပိုင်းအဖြစ် ကွဲပြားသောအရွယ်အစားရှိ အပိုင်းများကို ရွေးချယ်နိုင်စေပြီး ၎င်းတို့သည် bandwidth အတွက် အချင်းချင်း ပြိုင်ဆိုင်မည်မဟုတ်ပါ။

NVIDIA DGX A100- ပွဲဦးထွက် Ampere-based ပလပ်ဖောင်းသည် စွမ်းဆောင်ရည်ငါးခုကို ပေးစွမ်းသည်။

ယခင် DGX စနစ်များနှင့် နှိုင်းယှဉ်ပါက DGX A100 ၏ ခန္ဓာဗေဒမှာ ပြောင်းလဲမှုအချို့ ပြုလုပ်ထားသည်ကို သတိပြုသင့်ပါသည်။ HBM3 memory ပါသော A100 ဂရပ်ဖစ်ပရိုဆက်ဆာများတပ်ဆင်ထားသည့် SXM2 modules ၏ရေတိုင်ကီအတွင်းရှိအပူပိုက်အရေအတွက်သည် Volta မျိုးဆက်၏ Tesla V100 modules များနှင့်နှိုင်းယှဉ်ပါက သိသိသာသာတိုးလာသည်၊၊ အပေါ်ဖုံးအားဖြင့်။ ဤဒီဇိုင်းအတွက် လက်တွေ့ကန့်သတ်ချက်မှာ အပူစွမ်းအင် 400 W ဖြစ်သည်။ ယနေ့ထုတ်ဝေသော SXM100 ဗားရှင်းတွင် A3 ၏တရားဝင်ဝိသေသလက္ခဏာများဖြင့်လည်း ၎င်းကို အတည်ပြုထားသည်။

မားသားဘုတ်ပေါ်ရှိ A100 GPU များဘေးတွင် 4,8 TB/s မြန်နှုန်းဖြင့် နှစ်လမ်းသွားဒေတာဖလှယ်မှုကို ပံ့ပိုးပေးသည့် တတိယမျိုးဆက် NVLink interface ခလုတ်ခြောက်ခုရှိသည်။ NVIDIA သည် အပူပိုက်များဖြင့် အပြည့်အ၀ ရေတိုင်ကီများဖြင့် အကဲဖြတ်ကာ ၎င်းတို့၏ အအေးခံမှုကို အလေးထားပါသည်။ GPU တစ်ခုစီသည် NVLink interface ၏ ချန်နယ် 12 ခုကို ခွဲဝေပေးထားပြီး အိမ်နီးချင်း GPU များသည် 600 GB/s မြန်နှုန်းဖြင့် ဒေတာဖလှယ်နိုင်သည်။

DGX A100 စနစ်တွင် Mellanox ConnectX-6 HDR ကွန်ရက် ထိန်းချုပ်ကိရိယာ ကိုးခုကိုလည်း တပ်ဆင်ထားပြီး သတင်းအချက်အလက်များကို 200 Gbit/s အထိ အမြန်နှုန်းဖြင့် ထုတ်လွှင့်ပေးနိုင်သည်။ စုစုပေါင်း၊ DGX A100 သည် 3,6 TB/s အမြန်နှုန်းဖြင့် နှစ်လမ်းသွား ဒေတာလွှဲပြောင်းမှုကို ပံ့ပိုးပေးပါသည်။ စနစ်သည် ထိုသို့သော ဗိသုကာလက်ရာဖြင့် တွက်ချက်မှုစနစ်များကို ထိရောက်စွာ ချဲ့ထွင်ရန်အတွက် ရည်ရွယ်သည့် ကိုယ်ပိုင် Mellanox နည်းပညာများကိုလည်း အသုံးပြုပါသည်။ ပလပ်ဖောင်းအဆင့်ရှိ PCI Express 4.0 ပံ့ပိုးမှုကို AMD EPYC Rome မျိုးဆက်ပရိုဆက်ဆာများက ဆုံးဖြတ်သည်၊ ရလဒ်အနေဖြင့် ဤအင်တာဖေ့စ်ကို A100 ဂရပ်ဖစ်အရှိန်မြှင့်စက်များဖြင့်သာမက NVMe ပရိုတိုကောနှင့်အတူ solid-state drives များမှလည်း အသုံးပြုပါသည်။

NVIDIA DGX A100- ပွဲဦးထွက် Ampere-based ပလပ်ဖောင်းသည် စွမ်းဆောင်ရည်ငါးခုကို ပေးစွမ်းသည်။

DGX A100 အပြင် NVIDIA သည် အခြားထုတ်လုပ်သူများ ၎င်းတို့ကိုယ်တိုင်ထုတ်လုပ်မည့် ဆာဗာစနစ်များ၏ အစိတ်အပိုင်းများထဲမှ တစ်ခုဖြစ်သည့် HGX A100 ဘုတ်များနှင့် ၎င်း၏လုပ်ဖော်ကိုင်ဖက်များကို စတင်ထောက်ပံ့ပေးခဲ့သည်။ HGX A100 ဘုတ်တစ်ခုသည် NVIDIA A100 GPU လေးခု သို့မဟုတ် ရှစ်ခု ထားရှိနိုင်သည်။ ထို့အပြင်၎င်း၏ကိုယ်ပိုင်လိုအပ်ချက်များအတွက် NVIDIA သည် 140 DGX A100 စနစ်များအစုအဝေးတစ်ခုဖြစ်သည့် DGX SuperPOD ကို တပ်ဆင်ထားပြီး 700 petaflops တွင် စွမ်းဆောင်ရည်အတန်အသင့်ရှိသော အလုံးစုံအတိုင်းအတာဖြင့် စွမ်းဆောင်နိုင်ခဲ့သည်။ ကုမ္ပဏီသည် DGX A100 ကိုအခြေခံ၍ အလားတူကွန်ပြူတာအစုအဝေးများတည်ဆောက်လိုသောလုပ်ဖော်ကိုင်ဖက်များအား နည်းစနစ်ပိုင်းဆိုင်ရာအကူအညီပေးမည်ဟု ကတိပြုခဲ့သည်။ စကားမစပ်၊ ထိုသို့သောအလုပ်များအတွက် ပုံမှန်လပေါင်းများစွာ သို့မဟုတ် နှစ်များစွာအစား DGX SuperPOD ကိုတည်ဆောက်ရန် NVIDIA သည် တစ်လထက်မပိုပါ။

NVIDIA DGX A100- ပွဲဦးထွက် Ampere-based ပလပ်ဖောင်းသည် စွမ်းဆောင်ရည်ငါးခုကို ပေးစွမ်းသည်။

NVIDIA ၏ အဆိုအရ DGX A100 ကို တစ်အုပ်လျှင် $199 စျေးနှုန်းဖြင့် စတင်ရောင်းချနေပြီဖြစ်ပြီး ကုမ္ပဏီ၏လုပ်ဖော်ကိုင်ဖက်များသည် ၎င်းတို့၏ cloud အစုအဝေးများတွင် အဆိုပါစနစ်များကို လက်ခံဆောင်ရွက်ပေးနေပြီဖြစ်ပြီး ဂေဟစနစ်သည် ဗီယက်နမ်နှင့် UAE အပါအဝင် နိုင်ငံပေါင်း 000 နိုင်ငံကို လွှမ်းခြုံထားပြီးဖြစ်သည်။ ထို့အပြင်၊ Ampere ဗိသုကာနှင့်ဂရပ်ဖစ်ဖြေရှင်းချက်များသည် US စွမ်းအင်ဌာနအတွက် Cray မှဖန်တီးထားသော Perlmutter စူပါကွန်ပျူတာစနစ်၏တစ်စိတ်တစ်ပိုင်းဖြစ်မည်ဟုခန့်မှန်းနိုင်သည်။ ၎င်းတွင် Zen 26 ဗိသုကာလက်ရာဖြင့် AMD EPYC Milan မျိုးဆက်ဗဟိုပရိုဆက်ဆာများနှင့်အတူ NVIDIA Ampere ဂရပ်ဖစ်ပရိုဆက်ဆာများပါရှိသည်။ NVIDIA Ampere ကိုအခြေခံသည့်စူပါကွန်ပြူတာအမှတ်အသားများသည် ပထမအခွေ၏အထူးပြုဓာတ်ခွဲခန်းသို့ရောက်ရှိပြီးဖြစ်သော်လည်း ယခုနှစ်ဒုတိယနှစ်ဝက်တွင် သုံးစွဲသူထံရောက်ရှိမည်ဖြစ်သည်။ အမေရိကန်ဌာန။



source: 3dnews.ru

မှတ်ချက် Add