Intel Xeon သည် Tesla V100s ရှစ်ခုကို အာရုံကြောကွန်ရက်တစ်ခုကို လေ့ကျင့်ပေးသောအခါ အကြိမ်များစွာ စွမ်းဆောင်ရည်ထက် သာလွန်ခဲ့သည်။

ဗဟိုပရိုဆက်ဆာသည် နက်ရှိုင်းသော အာရုံကြောကွန်ရက်များကို သင်ယူသောအခါတွင် ဂရပ်ဖစ်ပရိုဆက်ဆာ ရှစ်ခုကို တစ်ကြိမ်တည်းပေါင်းစပ်ခြင်းထက် အဆများစွာ ပိုမြန်သည်။ သိပ္ပံစိတ်ကူးယဉ်ထဲက တစ်ခုခုလို့ထင်ရတာမဟုတ်လား? သို့သော် Intel Xeon ကို အသုံးပြု၍ Rice University မှ သုတေသီများက ဖြစ်နိုင်ကြောင်း သက်သေပြခဲ့သည်။

Intel Xeon သည် Tesla V100s ရှစ်ခုကို အာရုံကြောကွန်ရက်တစ်ခုကို လေ့ကျင့်ပေးသောအခါ အကြိမ်များစွာ စွမ်းဆောင်ရည်ထက် သာလွန်ခဲ့သည်။

GPU များသည် CPU များထက် နက်ရှိုင်းစွာ သင်ယူနိုင်သော အာရုံကြောကွန်ရက်များအတွက် အမြဲတမ်း သင့်လျော်ပါသည်။ ၎င်းသည် အာရုံကြောကွန်ရက်များကို လေ့ကျင့်သင်ကြားရန်အတွက် လိုအပ်သည့် အတိအကျဖြစ်သည့် သေးငယ်သောအလုပ်များစွာကို အပြိုင်လုပ်ဆောင်နိုင်သည့် သေးငယ်သော cores များစွာပါ၀င်သော GPU များ၏ တည်ဆောက်ပုံကြောင့်ဖြစ်သည်။ သို့သော် ဗဟိုပရိုဆက်ဆာများသည် မှန်ကန်သောချဉ်းကပ်မှုဖြင့် နက်ရှိုင်းသောသင်ယူမှုတွင် အလွန်ထိရောက်မှုရှိနိုင်ကြောင်း တွေ့ရှိရပါသည်။

SLIDE နက်နဲသောသင်ယူမှု algorithm ကိုအသုံးပြုသောအခါတွင် 44 cores ရှိသော Intel Xeon ပရိုဆက်ဆာသည် NVIDIA Tesla V3,5 ကွန်ပြူတာ အရှိန်မြှင့်စက် ရှစ်လုံးပေါင်းစပ်ထားသည်ထက် 100 ဆ ပိုမိုအကျိုးရှိကြောင်း သတင်းရရှိပါသည်။ ထိုသို့သောအခြေအနေမျိုးတွင် CPU သည် GPU ကိုဖမ်းမိရုံသာမက ၎င်းတို့ကို ကျော်တက်သွားကာ အလွန်သိသာထင်ရှားသည့်အရာဖြစ်နိုင်သည်မှာ ပထမဆုံးအကြိမ်ဖြစ်နိုင်သည်။

တက္ကသိုလ်မှထုတ်ပြန်သောသတင်းထုတ်ပြန်ချက်တွင် SLIDE algorithm သည် လုံးဝကွဲပြားခြားနားသောချဉ်းကပ်မှုကိုအသုံးပြုသောကြောင့် GPU များမလိုအပ်ကြောင်းဖော်ပြထားသည်။ ပုံမှန်အားဖြင့်၊ အာရုံကြောကွန်ရက်များကို လေ့ကျင့်သည့်အခါ၊ GPU အတွက် အကောင်းဆုံးဝန်ဖြစ်သည့် matrix multiplication ကိုအသုံးပြုသည့် လေ့ကျင့်ရေးအမှားအယွင်း backpropagation technique ကိုအသုံးပြုသည်။ အခြားတစ်ဖက်တွင် SLIDE သည် သင်ယူမှုကို hash tables များအသုံးပြု၍ ဖြေရှင်းနိုင်သော ရှာဖွေမှုပြဿနာအဖြစ်သို့ ပြောင်းလဲသည်။


Intel Xeon သည် Tesla V100s ရှစ်ခုကို အာရုံကြောကွန်ရက်တစ်ခုကို လေ့ကျင့်ပေးသောအခါ အကြိမ်များစွာ စွမ်းဆောင်ရည်ထက် သာလွန်ခဲ့သည်။

သုတေသီများအဆိုအရ၊ ၎င်းသည် လေ့ကျင့်ရေးအာရုံကြောကွန်ရက်များ၏ တွက်ချက်မှုကုန်ကျစရိတ်ကို သိသိသာသာ လျော့နည်းစေသည်။ အခြေခံအချက်တစ်ခုရရန်၊ သုတေသီများသည် Google ၏ TensorFlow စာကြည့်တိုက်ကို အသုံးပြု၍ အာရုံကြောကွန်ရက်တစ်ခုကို လေ့ကျင့်ရန် Tesla V100 အရှိန်မြှင့်စက် ရှစ်ခုပါရှိသော ဆန်တက္ကသိုလ်ဓာတ်ခွဲခန်း၏ လက်ရှိစနစ်အား အသုံးပြုခဲ့သည်။ လုပ်ငန်းစဉ်သည် 3,5 နာရီကြာသည်။ ယင်းနောက်၊ အလားတူ အာရုံကြောကွန်ရက်တစ်ခုကို 44-core Xeon ပရိုဆက်ဆာတစ်ခုတည်းဖြင့် စနစ်တွင် SLIDE algorithm ကိုအသုံးပြု၍ လေ့ကျင့်သင်ကြားခဲ့ပြီး 1 နာရီသာကြာမြင့်ခဲ့သည်။

Intel သည် လက်ရှိတွင် ၎င်း၏ထုတ်ကုန်အကွာအဝေးတွင် 44-core ပရိုဆက်ဆာမော်ဒယ်များ မရှိသေးသည်ကို သတိပြုသင့်သည်။ သုတေသီများသည် စိတ်ကြိုက် သို့မဟုတ် မထုတ်ဝေရသေးသော ချစ်ပ်တစ်မျိုးမျိုးကို အသုံးပြုခဲ့ခြင်း ဖြစ်နိုင်သော်လည်း ၎င်းမှာ မဖြစ်နိုင်ပေ။ 22-core Intel Xeons နှစ်ခုပါသည့် စနစ်တစ်ခုကို ဤနေရာတွင် အသုံးပြုခဲ့သည် သို့မဟုတ် သတင်းထုတ်ပြန်ချက်တွင် အမှားအယွင်းတစ်ခုရှိခဲ့ပြီး 44-core ပရိုဆက်ဆာတစ်ခုမှ ပံ့ပိုးပေးထားသည့် 22 threads အကြောင်းကို ကျွန်ုပ်တို့ပြောနေပါသည်။ မည်သို့ပင်ဆိုစေကာမူ ယင်းသည် အောင်မြင်မှုကို သူ့ဘာသာသူ နှောင့်ယှက်မည်မဟုတ်ပေ။

ဟုတ်ပါတယ်၊ SLIDE algorithm သည် စမ်းသပ်မှုများစွာကို ဖြတ်သန်းပြီး ၎င်း၏ထိရောက်မှုကို သက်သေပြရမည့်အပြင် ထူးခြားမှုနှင့် ချို့ယွင်းချက်တစ်စုံတစ်ရာမရှိခြင်းကိုလည်း သက်သေပြရမည်ဖြစ်သည်။ သို့သော်၊ ယခုကျွန်ုပ်တို့တွေ့မြင်ရသည့်အရာသည် အလွန်အထင်ကြီးစရာကောင်းပြီး စက်မှုလုပ်ငန်းဖွံ့ဖြိုးတိုးတက်မှုအပေါ် အမှန်တကယ်အကျိုးသက်ရောက်မှုရှိနိုင်ပါသည်။



source: 3dnews.ru

မှတ်ချက် Add