Magic Ensemble သင်ယူခဌင်သ။

ဟေသ ဟာဘ! á€€á€»á€œá€”်ုပ်တို့သည် အခမဲ့ သရုပ်ပဌသင်ခန်သစာသို့ ဒေတာအင်ဂျင်နီယာမျာသနဟင့် Machine Learning ကျလမ်သကျင်သူမျာသကို ဖိတ်ခေါ်ပါသည်။ "အလန်လိုင်သ အကဌံပဌုချက်မျာသ နမူနာကို အသုံသပဌု၍ စက်မဟုပတ်ဝန်သကျင်သို့ ML မော်ဒယ်မျာသ မိတ်ဆက်ခဌင်သ". CDP SpA မဟ Financial Analytics အကဌီသအကဲ Luca Monno မဟ ဆောင်သပါသတစ်ပုဒ်ကိုလည်သ ထုတ်ဝေပါသည်။

အသုံသဝင်ဆုံသနဟင့် ရိုသရဟင်သသော စက်သင်ယူမဟုနည်သလမ်သမျာသထဲမဟတစ်ခုမဟာ Ensemble Learning ဖဌစ်သည်။ Ensemble Learning သည် XGBoost၊ Bagging၊ Random Forest နဟင့် အခဌာသသော algorithms မျာသစလာအတလက် အခဌေခံနည်သပညာဖဌစ်သည်။

Towards Data Science နဲ့ ပတ်သက်တဲ့ ဆောင်သပါသကောင်သတလေ အမျာသကဌီသရဟိပေမယ့် ကျလန်တော် ဇာတ်လမ်သနဟစ်ပုဒ် ရလေသခဲ့တယ် (ပဌမ О ဒုတိယ) ကျလန်တော် အနဟစ်သက်ဆုံသပါ။ ဒါဆို ဘာကဌောင့် EL အကဌောင်သ နောက်ဆောင်သပါသရေသတာလဲ။ ငါ မင်သကို ပဌချင်တာမို့လာသ။ ရိုသရဟင်သသော ဥပမာတစ်ခုတလင် ၎င်သသည် မည်သို့အလုပ်လုပ်သည်၊ ကနေရာ၌ မဟော်ပညာမရဟိသည်ကို နာသလည်စေခဲ့သည်။

EL လုပ်ဆောင်ချက်ကို ပထမဆုံသမဌင်ရသောအခါ (အလလန်ရိုသရဟင်သသော ဆုတ်ယုတ်မဟုပုံစံအချို့နဟင့် အလုပ်လုပ်သည်) သည် မျက်လုံသမျာသကို မယုံနိုင်ဖဌစ်ပဌီသ ကနည်သလမ်သကို သင်ပေသသော ပါမောက္ခကို မဟတ်မိနေသေသသည်။

ကျလန်ုပ်တလင် ထပ်ကိန်သမျာသပါသော မတူညီသော မော်ဒယ်နဟစ်ခု (အာသနည်သသော သင်ယူမဟု အယ်လဂိုရီသမ် နဟစ်ခု) ရဟိခဲ့သည်။ နမူနာပဌင်ပ R² သည် 0,90 နဟင့် 0,93 အသီသသီသရဟိသည်။ ရလဒ်ကို မကဌည့်မီ၊ ကနညသတန်ဖိုသနဟစ်ခုကဌာသတလင် R² ရမည်ဟု တလေသခဲ့သည်။ တစ်နည်သဆိုရသော် EL ကို အဆိုသဆုံသမော်ဒယ်လောက် မစလမ်သဆောင်နိုင်စေရန် EL ကို သုံသနိုင်မည်ဟု ထင်ခဲ့သော်လည်သ အကောင်သဆုံသ မော်ဒယ်အဖဌစ် မရနိုင်ပါ။

ကျလန်ုပ်၏ အံ့အာသသင့်စရာမဟာ၊ ရိုသရဟင်သသော ခန့်မဟန်သချက်မျာသ၏ ရလဒ်မျာသသည် R² ၏ 0,95 ဖဌစ်သည်။ 

အစပိုင်သမဟာတော့ အမဟာသတစ်ခုကို ရဟာကဌည့်တော့၊ ဒါပေမယ့် ဒီနေရာမဟာ မဟော်အတတ်တလေ ဝဟက်ထာသနိုင်တယ်လို့ ထင်ခဲ့တယ်။

Ensemble Learning ဆိုတာဘာလဲ

EL ဖဌင့်၊ သင်သည် ပိုမိုယုံကဌည်စိတ်ချရပဌီသ စလမ်သဆောင်ရည်ရဟိသော မော်ဒယ်ကို ရရဟိရန်အတလက် မော်ဒယ်နဟစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော ခန့်မဟန်သချက်မျာသကို ပေါင်သစပ်နိုင်ပါသည်။ မော်ဒယ်မျာသ၏အစုအဝေသမျာသနဟင့်အလုပ်လုပ်ရန်နည်သလမ်သမျာသစလာရဟိသည်။ ကတလင် ကျလန်ုပ်သည် သင့်အာသ အကဌံဥာဏ်တစ်ခုပေသရန် အသုံသဝင်ဆုံသ နဟစ်ခုကို နဟိပ်လိုက်ပါမည်။

နဟင့် ဆုတ်ယုတ်မဟု ရရဟိနိုင်သော မော်ဒယ်မျာသ၏ စလမ်သဆောင်ရည်ကို ပျမ်သမျဟနိုင်သည်။

နဟင့် အမျိုသအစာသခလဲခဌာသခဌင်သ မော်ဒယ်မျာသကို အညလဟန်သမျာသ ရလေသချယ်ခလင့်ပေသနိုင်သည်။ အမျာသဆုံသရလေသချယ်ခံရသောတံဆိပ်သည် မော်ဒယ်အသစ်မဟ ရလေသချယ်မည့်တံဆိပ်ဖဌစ်သည်။

ဘာကဌောင့် EL က ပိုကောင်သသလဲ။

EL ပိုမိုကောင်သမလန်စလာအလုပ်လုပ်ရခဌင်သ၏ အဓိကအကဌောင်သရင်သမဟာ ခန့်မဟန်သချက်တစ်ခုစီတလင် အမဟာသတစ်ခုရဟိသောကဌောင့်ဖဌစ်သည် (ဖဌစ်နိုင်ခဌေသီအိုရီမဟ ကျလန်ုပ်တို့သိထာသသည်)၊ ခန့်မဟန်သချက်နဟစ်ခုကိုပေါင်သစပ်ခဌင်သဖဌင့် error ကိုလျဟော့ချနိုင်ပဌီသ စလမ်သဆောင်ရည်အညလဟန်သမျာသ (RMSE၊ R² စသည်ဖဌင့်) တိုသတက်ကောင်သမလန်လာသောကဌောင့်ဖဌစ်သည်။ d.)။

ဒေတာအတလဲတစ်ခုပေါ်တလင် အာသနည်သသော အယ်လဂိုရီသမ်နဟစ်ခု အလုပ်လုပ်ပုံကို အောက်ပါပုံတလင် ပဌသထာသသည်။ ပထမ algorithm သည် လိုအပ်သည်ထက် ပိုကဌီသသော slope ရဟိပဌီသ၊ ဒုတိယသည် သုညနီသပါသ (ပုံမဟန်အလလန်အကျလံပဌုလုပ်ခဌင်သကဌောင့် ဖဌစ်နိုင်သည်)။ ဒါပေမယ့် ensemble ပိုမိုကောင်သမလန်သောရလဒ်မျာသကိုပဌသသည်။ 

R² ကိုကဌည့်လျဟင် ပထမနဟင့် ဒုတိယလေ့ကျင့်ရေသ algorithm သည် -0.01¹၊ 0.22 အသီသသီသရဟိမည်ဖဌစ်ပဌီသ အစုအဝေသအတလက် 0.73 နဟင့် ညီမျဟမည်ဖဌစ်သည်။

Magic Ensemble သင်ယူခဌင်သ။

အယ်လဂိုရီသမ်တစ်ခုသည် ကကဲ့သို့သော အခဌေခံဥပမာတစ်ခုအတလက်ပင် ညံ့ဖျင်သသောစံနမူနာဖဌစ်ရသည့် အကဌောင်သရင်သမျာသစလာရဟိသည်- အလလန်အကျလံမဖဌစ်အောင် ပုံမဟန်ပဌုလုပ်ရန် သင်ဆုံသဖဌတ်ခဲ့သည် သို့မဟုတ် အချို့သောကလဲလလဲချက်မျာသကို မဖယ်ရဟာသရန် ဆုံသဖဌတ်ခဲ့သည်၊ သို့မဟုတ် သင်သည် polynomial regression ကိုအသုံသပဌုပဌီသ မဟာသယလင်သသောဒီဂရီကို ရလေသချယ်လိုက်ခဌင်သဖဌစ်နိုင်သည်။ (ဥပမာ၊ ဒုတိယဒီဂရီ၏ polynomial ကိုသုံသ၍ စမ်သသပ်မဟုဒေတာသည် ရဟင်သရဟင်သလင်သလင်သ အချိုသမညီမဟုကို ပဌသသည်၊ ၎င်သအတလက် တတိယဒီဂရီသည် ပိုသင့်လျော်မည်)။

EL သည် အကောင်သဆုံသအလုပ်လုပ်သောအခါ

တူညီသောဒေတာပေါ်တလင်အလုပ်လုပ်သောသင်ယူမဟု algorithms နဟစ်ခုကိုကဌည့်ကဌပါစို့။

Magic Ensemble သင်ယူခဌင်သ။

မော်ဒယ်နဟစ်ခုကို ပေါင်သစပ်ပဌီသ စလမ်သဆောင်ရည်ကို မျာသစလာမတိုသတက်ကဌောင်သ ကနေရာတလင် တလေ့မဌင်နိုင်သည်။ အစပိုင်သတလင်၊ လေ့ကျင့်ရေသ အယ်လဂိုရီသမ်နဟစ်ခုအတလက် R² တန်ဖိုသမျာသသည် -0,37 နဟင့် 0,22 အသီသသီသဖဌစ်ပဌီသ အစုအဝေသအတလက် -0,04 ဖဌစ်လာသည်။ ဆိုလိုသည်မဟာ EL မော်ဒယ်သည် အညလဟန်သကိန်သမျာသ၏ ပျမ်သမျဟတန်ဖိုသကို ရရဟိခဲ့သည်။

သို့သော်၊ ကဥပမာနဟစ်ခုကဌာသတလင် ကဌီသမာသသောကလာခဌာသချက်တစ်ခုရဟိသည်- ပထမဥပမာတလင်၊ မော်ဒယ်မျာသ၏အမဟာသမျာသသည် အနုတ်လက္ခဏာဆက်နလယ်နေပဌီသ ဒုတိယတလင် အပဌုသဘောဖဌင့် (မော်ဒယ်သုံသမျိုသ၏ကိန်သဂဏန်သမျာသကို မခန့်မဟန်သထာသသော်လည်သ စာရေသသူက ရိုသရိုသရဟင်သရဟင်သပင် ရလေသချယ်ခဲ့ခဌင်သဖဌစ်သည်။ ဥပမာအနေနဲ့။)

ထို့ကဌောင့်၊ Ensemble Learning ကို ကိစ္စရပ်တိုင်သတလင် ဘက်လိုက်မဟု/ပျံ့နဟံ့မဟု ဟန်ချက်ညီမဟုကို တိုသတက်စေရန်အတလက် အသုံသပဌုနိုင်သည်။ မော်ဒယ်အမဟာသအယလင်သမျာသသည် အပဌုသဘောဆောင်သောဆက်စပ်မဟုမရဟိပါ၊ EL ကိုအသုံသပဌုခဌင်သဖဌင့် ပိုမိုကောင်သမလန်သောစလမ်သဆောင်ရည်ကိုဖဌစ်ပေါ်စေနိုင်သည်။.

တစ်သာသတည်သဖဌစ်နေခဌင်သနဟင့် ကလဲပဌာသသောပုံစံမျာသ

မကဌာခဏဆိုသလို EL ကို တစ်သာသတည်သကျသော မော်ဒယ်မျာသတလင် (ကဥပမာ သို့မဟုတ် ကျပန်သသစ်တောကဲ့သို့) တလင်အသုံသပဌုသော်လည်သ အမဟန်တကယ်တလင် မတူညီသောပုံစံမျာသ (linear regression + neural network + XGBoost) ကို မတူညီသောရဟင်သပဌကိန်သရဟင်အစုံမျာသဖဌင့် ပေါင်သစပ်နိုင်သည်။ ၎င်သသည် ဆက်နလဟယ်မဟုမရဟိသော အမဟာသမျာသကို ဖဌစ်ပေါ်စေပဌီသ စလမ်သဆောင်ရည်ကို မဌဟင့်တင်နိုင်ဖလယ်ရဟိသည်။

အစုစု ကလဲပဌာသခဌင်သနဟင့် နဟိုင်သယဟဉ်ခဌင်သ။

EL သည် အစုစုသီအိုရီတလင် ကလဲပဌာသခဌင်သအတလက် အလာသတူနည်သလမ်သဖဌင့် လုပ်ဆောင်သော်လည်သ ကျလန်ုပ်တို့အတလက် ပိုကောင်သပါသည်။ 

ကလဲပဌာသသောအခါတလင်၊ ဆက်နလဟယ်မဟုမရဟိသော စတော့ရဟယ်ယာမျာသတလင် ရင်သနဟီသမဌဟုပ်နဟံခဌင်သဖဌင့် သင့်စလမ်သဆောင်ရည်တလင် ကလဲလလဲမဟုကို လျဟော့ချရန် ကဌိုသစာသသည်။ ကောင်သစလာကလဲပဌာသသောစတော့ရဟယ်ယာအစုစုသည် အဆိုသဆုံသသောစတော့ရဟယ်ယာမျာသထက် သာလလန်ကောင်သမလန်သော်လည်သ အကောင်သဆုံသထက် ဘယ်တော့မဟ ပိုကောင်သမည်မဟုတ်ပါ။

Warren Buffett ကိုကိုသကာသ- 

"ကလဲပဌာသခဌင်သသည် မောဟကို ခုခံခဌင်သဖဌစ်သည်၊ သူဘာလုပ်နေသည်ကို မသိသောသူတစ်ညသအတလက်၊ ၎င်သသည် အဓိပ္ပါယ်အနည်သငယ်သာရဟိသည်။"

စက်သင်ယူမဟုတလင် EL သည် သင့်မော်ဒယ်၏ကလဲပဌာသမဟုကို လျဟော့ချပေသသည်၊ သို့သော် ၎င်သသည် အကောင်သဆုံသကနညသမော်ဒယ်ထက် အလုံသစုံစလမ်သဆောင်ရည်ပိုကောင်သသော မော်ဒယ်ကို ဖဌစ်ပေါ်စေနိုင်သည်။

အနဟစ်ချုပ်ရန်

မော်ဒယ်မျာသစလာကို တစ်ခုတည်သအဖဌစ် ပေါင်သစပ်ခဌင်သသည် ကလဲပဌာသမဟု ဘက်လိုက်မဟုပဌဿနာကို ဖဌေရဟင်သချက်ပေသနိုင်သည့် ရိုသရဟင်သသောနည်သလမ်သတစ်ခုဖဌစ်သည်။

သင့်တလင် ကောင်သမလန်စလာအလုပ်လုပ်နိုင်သော မော်ဒယ်နဟစ်ခု သို့မဟုတ် ထို့ထက်ပိုပါက ၎င်သတို့ကဌာသတလင် မရလေသချယ်ပါနဟင့်- ၎င်သတို့အာသလုံသကို အသုံသပဌုပါ (သို့သော်လည်သ သတိဖဌင့်)။

ဒီလမ်သကဌောင်သကို တိုသတက်အောင်လုပ်ဖို့ စိတ်ဝင်စာသပါသလာသ။ အခမဲ့သရုပ်ပဌသင်ခန်သစာအတလက် စာရင်သသလင်သပါ။ "အလန်လိုင်သ အကဌံပဌုချက်မျာသ နမူနာကို အသုံသပဌု၍ စက်မဟုပတ်ဝန်သကျင်သို့ ML မော်ဒယ်မျာသ မိတ်ဆက်ခဌင်သ" ပါဝင်ဆောင်ရလက်ပါ။ Andrey Kuznetsov နဟင့်အလန်လိုင်သတလေ့ဆုံမဟု — Mail.ru Group ရဟိ စက်သင်ယူမဟုအင်ဂျင်နီယာ။

source: www.habr.com

မဟတ်ချက် Add