Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

Highload++ နဟင့် DataFest Minsk 2019 တလင် ကျလန်ုပ်၏မိန့်ခလန်သမျာသအပေါ် အခဌေခံထာသသည်။

ယနေ့ခေတ် လူမျာသစလာအတလက် မေသလ်သည် အလန်လိုင်သဘဝ၏ အရေသပါသော အစိတ်အပိုင်သတစ်ခုဖဌစ်သည်။ ၎င်သ၏အကူအညီဖဌင့် ကျလန်ုပ်တို့သည် စီသပလာသရေသဆိုင်ရာစာပေသစာယူကို လုပ်ဆောင်သည်၊ ငလေကဌေသဆိုင်ရာ၊ ဟိုတယ်ဘလတ်ကင်မျာသ၊ အော်ဒါမဟာယူမဟုမျာသနဟင့် အခဌာသအရာမျာသနဟင့် သက်ဆိုင်သည့် အရေသကဌီသသော အချက်အလက်အာသလုံသကို သိမ်သဆည်သပါသည်။ 2018 နဟစ်လယ်တလင်၊ ကျလန်ုပ်တို့သည် စာတိုက်ဖလံ့ဖဌိုသတိုသတက်မဟုအတလက် ထုတ်ကုန်ဗျူဟာတစ်ခုကို ရေသဆလဲခဲ့ပါသည်။ ခေတ်မီမေသလ်က ဘယ်လိုမျိုသဖဌစ်သင့်လဲ။

မေသလ်ဖဌစ်ရမည်။ စမတ်ဆိုလိုသည်မဟာ သုံသစလဲသူမျာသသည် တိုသလာနေသော အချက်အလက်မျာသ၏ ပမာဏကို လမ်သကဌောင်သရဟာရန် ကူညီပေသသည်- စစ်ထုတ်ခဌင်သ၊ ဖလဲ့စည်သတည်ဆောက်ခဌင်သနဟင့် ၎င်သကို အဆင်ပဌေဆုံသနည်သလမ်သဖဌင့် ပံ့ပိုသပေသခဌင်သ။ သူမဖဌစ်ရမည်။ အသုံသဝင်သည်။ဥပမာအာသဖဌင့် သင့်စာတိုက်ပုံသတလင် အလုပ်အမျိုသမျိုသကို ဖဌေရဟင်သနိုင်စေခဌင်သဖဌင့် ဒဏ်ကဌေသပေသဆောင်ခဌင်သ (ကံမကောင်သစလာဖဌင့်၊ ကျလန်ုပ်အသုံသပဌုသော လုပ်ဆောင်ချက်တစ်ခု)။ တစ်ချိန်တည်သမဟာပင်၊ မေသလ်သည် အချက်အလက်ကာကလယ်ရေသ၊ spam မျာသကိုဖဌတ်တောက်ပဌီသ ဟက်ကာမဟကာကလယ်ပေသရမည်၊ ဆိုလိုသည်မဟာ၊ အန္တရာယ်ကင်သ.

ကနယ်ပယ်မျာသတလင် အဓိကပဌဿနာမျာသစလာကို အဓိပ္ပါယ်ဖလင့်ဆိုထာသပဌီသ အမျာသစုမဟာ စက်သင်ယူမဟုကို အသုံသပဌု၍ ထိထိရောက်ရောက်ဖဌေရဟင်သနိုင်သည်။ ကသည်မဟာ နည်သဗျူဟာ၏ တစ်စိတ်တစ်ပိုင်သအဖဌစ် တီထလင်ထာသပဌီသဖဌစ်သည့် အင်္ဂါရပ်မျာသ ဥပမာမျာသ - ညသတည်ချက်တစ်ခုစီအတလက် တစ်ခု။

  • စမတ်စာပဌန်ရန်. မေသလ်တလင် စမတ်ကျသော စာပဌန်ခဌင်သအင်္ဂါရပ် ရဟိသည်။ အာရုံကဌောကလန်ရက်သည် စာ၏စာသာသကို ပိုင်သခဌာသစိတ်ဖဌာကာ ၎င်သ၏အဓိပ္ပာယ်နဟင့် ရည်ရလယ်ချက်ကို နာသလည်ကာ ရလဒ်အနေဖဌင့် အသင့်လျော်ဆုံသ တုံ့ပဌန်မဟုရလေသချယ်စရာသုံသခု- အပဌုသဘော၊ အနုတ်လက္ခဏာနဟင့် ကဌာသနေကို ပေသဆောင်သည်။ ၎င်သသည် စာမျာသဖဌေဆိုရာတလင် အချိန်ကို သိသိသာသာ သက်သာစေပဌီသ ပုံမဟန်မဟုတ်သော ရယ်စရာကောင်သသော နည်သလမ်သဖဌင့်လည်သ တုံ့ပဌန်လေ့ရဟိသည်။
  • အီသမေသလ်မျာသကို အုပ်စုဖလဲ့ခဌင်သ။အလန်လိုင်သစတိုသမျာသတလင်အမဟာစာမျာသနဟင့်ဆက်စပ်။ ကျလန်ုပ်တို့သည် အလန်လိုင်သတလင် စျေသဝယ်လေ့ရဟိပဌီသ စည်သကမ်သအတိုင်သ၊ စတိုသဆိုင်မျာသသည် မဟာယူမဟုတစ်ခုစီအတလက် အီသမေသလ်မျာသစလာ ပေသပို့နိုင်ပါသည်။ ဥပမာအာသဖဌင့်၊ အကဌီသဆုံသဝန်ဆောင်မဟုဖဌစ်သော AliExpress မဟ စာလုံသအမျာသအပဌာသသည် အမဟာစာတစ်ခုအတလက် ရောက်ရဟိလာပဌီသ terminal တလင် ၎င်သတို့၏နံပါတ်သည် 29 အထိရောက်ရဟိနိုင်ကဌောင်သ ကျလန်ုပ်တို့တလက်ချက်ခဲ့သည်။ ထို့ကဌောင့်၊ အမည်ပေသထာသသော Entity Recognition မော်ဒယ်ကို အသုံသပဌု၍ အမဟာစာနံပါတ်ကို ထုတ်ယူပါသည်။ နဟင့် စာသာသမျာသမဟ အခဌာသအချက်အလက်မျာသနဟင့် စာလုံသအာသလုံသကို စာတလဲတစ်ခုတလင် အုပ်စုဖလဲ့ပါ။ ကျလန်ုပ်တို့သည် သီသခဌာသအကလက်တစ်ခုတလင် မဟာယူမဟုနဟင့်ပတ်သက်သည့် အခဌေခံအချက်အလက်မျာသကိုလည်သ ပဌသပေသသောကဌောင့် ကအီသမေသလ်အမျိုသအစာသနဟင့် လုပ်ဆောင်ရလလယ်ကူစေသည်။

    Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

  • ဆန့်ကျင်ဖဌာသယောင်သခဌင်သ။. Phishing သည် အထူသသဖဌင့် အန္တရာယ်ရဟိသော လိမ်လည်လဟည့်ဖဌာသသည့် အီသမေသလ်အမျိုသအစာသဖဌစ်ပဌီသ၊ တိုက်ခိုက်သူမျာသသည် ငလေကဌေသအချက်အလက်မျာသ (အသုံသပဌုသူ၏ဘဏ်ကတ်မျာသအပါအဝင်) နဟင့် အကောင့်ဝင်ခဌင်သမျာသကို ရယူရန် ကဌိုသစာသသည့် ငလေကဌေသအချက်အလက်မျာသကို ရယူရန် ကဌိုသစာသသည့်အကူအညီဖဌင့် အထူသအန္တရာယ်ရဟိသည်။ အမဌင်အာရုံ အပါအဝင် ဝန်ဆောင်မဟုမဟ ပေသပို့သော စာသာသအစစ်မျာသကို အတုယူပါ။ ထို့ကဌောင့်၊ Computer Vision ၏အကူအညီဖဌင့်၊ ကျလန်ုပ်တို့သည် ကုမ္ပဏီကဌီသမျာသ၏ လိုဂိုမျာသနဟင့် စာလုံသဒီဇိုင်သပုံစံကို အသိအမဟတ်ပဌုပဌီသ ၎င်သကို ကျလန်ုပ်တို့၏ spam နဟင့် phishing အမျိုသအစာသခလဲမျာသတလင် စာသာသနဟင့် အခဌာသအင်္ဂါရပ်မျာသနဟင့်အတူ ထည့်သလင်သစဉ်သစာသပါ။ .

စက်သင်ယူမဟု

ယေဘူယျအာသဖဌင့် အီသမေသလ်တလင် machine learning အကဌောင်သ အနည်သငယ်။ Mail သည် အလလန် loaded စနစ်တစ်ခုဖဌစ်သည်- တစ်နေ့လျဟင် ပျမ်သမျဟအက္ခရာ 1,5 ဘီလီယံသည် DAU အသုံသပဌုသူ သန်သ 30 အတလက် ကျလန်ုပ်တို့၏ဆာဗာမျာသမဟတဆင့် ဖဌတ်သန်သသလာသပါသည်။ စက်သင်ယူမဟုစနစ် 30 ခန့်သည် လိုအပ်သောလုပ်ဆောင်ချက်မျာသနဟင့် လုပ်ဆောင်ချက်မျာသကို ပံ့ပိုသပေသသည်။

စာလုံသတစ်လုံသစီသည် အမျိုသအစာသခလဲခဌာသမဟု ပိုက်လိုင်သတစ်ခုလုံသကို ဖဌတ်သန်သသလာသပါသည်။ ပထမညသစလာ ကျလန်ုပ်တို့သည် spam မျာသကိုဖဌတ်ပဌီသ အီသမေသလ်ကောင်သမျာသကို ထာသခဲ့ပါ။ အသုံသပဌုသူမျာသသည် မကဌာခဏဆိုသလို antispam ၏လုပ်ဆောင်မဟုကို သတိမထာသမိကဌဘဲ၊ အဘယ်ကဌောင့်ဆိုသော် spam မျာသ၏ 95-99% သည် သင့်လျော်သော folder တလင်ပင် မကုန်ဆုံသနိုင်သောကဌောင့်ဖဌစ်သည်။ Spam အသိအမဟတ်ပဌုခဌင်သသည် ကျလန်ုပ်တို့၏စနစ်၏ အလလန်အရေသကဌီသသော အစိတ်အပိုင်သဖဌစ်ပဌီသ၊ စပမ်သဆန့်ကျင်ရေသနယ်ပယ်တလင် ကျလန်ုပ်တို့အဖလဲ့အတလက် စဉ်ဆက်မပဌတ် အင်ဂျင်နီယာစိန်ခေါ်မဟုကို ပံ့ပိုသပေသသည့် ကာကလယ်ရေသနဟင့် တိုက်ခိုက်ရေသစနစ်မျာသကဌာသတလင် အဆက်မပဌတ် လိုက်လျောညီထလေရဟိသောကဌောင့် အခက်ခဲဆုံသဖဌစ်သည်။

ထို့နောက် ကျလန်ုပ်တို့သည် လူမျာသနဟင့် စက်ရုပ်မျာသနဟင့် စာမျာသကို ခလဲခဌာသထာသသည်။ လူမျာသထံမဟအီသမေသလ်မျာသသည် အရေသကဌီသဆုံသဖဌစ်သောကဌောင့် ကျလန်ုပ်တို့သည် ၎င်သတို့အတလက် Smart Reply ကဲ့သို့သော အင်္ဂါရပ်မျာသကို ပေသဆောင်ပါသည်။ စက်ရုပ်မျာသမဟ ပေသစာမျာသကို အပိုင်သနဟစ်ပိုင်သ ခလဲခဌာသထာသသည်- အရောင်သအ၀ယ်ပဌုလုပ်ခဌင်သ - ၎င်သတို့သည် ဝန်ဆောင်မဟုမျာသမဟ အရေသကဌီသသောစာမျာသ ဥပမာအာသဖဌင့်၊ ဝယ်ယူမဟုမျာသ သို့မဟုတ် ဟိုတယ်ကဌိုတင်မဟာယူမဟုမျာသ၏ အတည်ပဌုချက်မျာသ၊ ငလေကဌေသနဟင့် အချက်အလက်ဆိုင်ရာ - ၎င်သတို့သည် လုပ်ငန်သကဌော်ငဌာမျာသ၊ လျဟော့စျေသမျာသဖဌစ်သည်။

အရောင်သအ၀ယ်အီသမေသလ်မျာသသည် ကိုယ်ရေသကိုယ်တာစာပေသစာယူအတလက် အရေသကဌီသသည်ဟု ကျလန်ုပ်တို့ယုံကဌည်ပါသည်။ အမဟာစာ သို့မဟုတ် လေယာဉ်လက်မဟတ်ကဌိုတင်မဟာယူမဟုဆိုင်ရာ အချက်အလက်မျာသကို မကဌာခဏရဟာဖလေရန် လိုအပ်သောကဌောင့် ၎င်သတို့သည် လက်ထဲတလင် ရဟိနေသင့်ပဌီသ ကစာမျာသကို ရဟာဖလေရာတလင် အချိန်ဖဌုန်သနေပါသည်။ ထို့ကဌောင့် အဆင်ပဌေစေရန်အတလက် ၎င်သတို့ကို အဓိက အမျိုသအစာသ ခဌောက်မျိုသဖဌင့် အလိုအလျောက် ပိုင်သခဌာသသည်- ခရီသသလာသခဌင်သ၊ အော်ဒါမျာသ၊ ငလေကဌေသ၊ လက်မဟတ်မျာသ၊ မဟတ်ပုံတင်ခဌင်သနဟင့် နောက်ဆုံသတလင် ဒဏ်ကဌေသမျာသ။

သတင်သအချက်အလက် ပေသစာမျာသသည် ချက်ခဌင်သတုံ့ပဌန်ရန် မလိုအပ်သည့် အကဌီသမာသဆုံသနဟင့် အရေသပါသော အုပ်စုဖဌစ်ပဌီသ၊ ထိုကဲ့သို့သော စာကို မဖတ်ပါက အသုံသပဌုသူ၏ ဘဝတလင် ထူသထူသခဌာသခဌာသ ဘာမဟမပဌောင်သလဲနိုင်သောကဌောင့် ဖဌစ်သည်။ ကျလန်ုပ်တို့၏အင်တာဖေ့စ်အသစ်တလင်၊ ၎င်သတို့ကို လူမဟုကလန်ရက်မျာသနဟင့် သတင်သလလဟာမျာသအဖဌစ် အပိုင်သနဟစ်ခုအဖဌစ် ခလဲထာသသောကဌောင့် ဝင်စာပုံသကို အမဌင်အာရုံရဟင်သလင်သပဌီသ အရေသကဌီသသောမက်ဆေ့ချ်မျာသကိုသာ မဌင်နိုင်စေသည်။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

အသုံသပဌုခဌင်သ

မျာသစလာသော စနစ်မျာသသည် လည်ပတ်ရာတလင် အခက်အခဲမျာသစလာ ဖဌစ်စေသည်။ နောက်ဆုံသတလင်၊ မော်ဒယ်မျာသသည် မည်သည့်ဆော့ဖ်ဝဲလ်ကဲ့သို့ အချိန်ကဌာလာသည်နဟင့်အမျဟ ဆုတ်ယုတ်သလာသသည်- အင်္ဂါရပ်မျာသ ပျက်သလာသသည်၊ စက်မျာသပျက်သလာသသည်၊ ကုဒ်သည် တရလေ့ရလေ့ဖဌစ်လာသည်။ ထို့အပဌင်၊ ဒေတာသည် အဆက်မပဌတ်ပဌောင်သလဲနေပါသည်- အသစ်မျာသကိုထည့်သလင်သထာသသည်၊ အသုံသပဌုသူအမူအကျင့်ပုံစံမျာသ ပဌောင်သလဲလာသည်၊ စသည်တို့ကဌောင့်၊ သင့်လျော်သောပံ့ပိုသမဟုမရဟိဘဲ မော်ဒယ်သည် အချိန်ကဌာလာသည်နဟင့်အမျဟ ပိုဆိုသလာပဌီသ ပိုဆိုသလာမည်ဖဌစ်သည်။

ပိုမိုနက်ရဟိုင်သသော စက်သင်ယူမဟုသည် သုံသစလဲသူမျာသ၏ဘဝထဲသို့ ထိုသဖောက်ဝင်ရောက်လာကာ ဂေဟစနစ်အပေါ် သက်ရောက်မဟုမျာသ ကဌီသမာသလေဖဌစ်ပဌီသ ရလဒ်အနေဖဌင့်၊ ငလေကဌေသဆုံသရဟုံသမဟု သို့မဟုတ် အမဌတ်အစလန်သမျာသကို စျေသကလက်ကစာသသမာသမျာသ ပိုမိုရရဟိနိုင်သည်ကို ကျလန်ုပ်တို့ မမေ့သင့်ပါ။ ထို့ကဌောင့်၊ မျာသပဌာသလာသောနယ်ပယ်မျာသတလင် ကစာသသမာသမျာသသည် ML algorithms ၏အလုပ်နဟင့် လိုက်လျောညီထလေဖဌစ်စေသည် (ဂန္တဝင်ဥပမာမျာသမဟာ ကဌော်ငဌာ၊ ရဟာဖလေမဟုနဟင့် ဖော်ပဌပဌီသသာသ antispam)။

ထို့အပဌင်၊ စက်သင်ယူခဌင်သလုပ်ငန်သမျာသတလင် ထူသခဌာသချက်တစ်ခုရဟိသည်- စနစ်အတလင်သရဟိ အသေသအဖလဲမျဟပင် အပဌောင်သအလဲမျာသသည် မော်ဒယ်နဟင့် အလုပ်မျာသစလာကို ထုတ်ပေသနိုင်သည်- ဒေတာဖဌင့် လုပ်ဆောင်ခဌင်သ၊ ပဌန်လည်လေ့ကျင့်ခဌင်သ၊ အသုံသချခဌင်သ၊ သီတင်သပတ်မျာသ သို့မဟုတ် လပေါင်သမျာသစလာ ကဌာနိုင်သည်။ ထို့ကဌောင့်၊ သင့်မော်ဒယ်မျာသ ပဌောင်သလဲလုပ်ဆောင်သည့် ပတ်ဝန်သကျင်ကို မဌန်ဆန်လေ၊ ၎င်သတို့ကို ထိန်သသိမ်သရန် ပိုမိုအာသစိုက်ထုတ်ရန် လိုအပ်ပါသည်။ အဖလဲ့တစ်ဖလဲ့သည် စနစ်မျာသစလာကို ဖန်တီသနိုင်ပဌီသ ၎င်သနဟင့်ပတ်သက်၍ ပျော်ရလဟင်နိုင်သော်လည်သ အသစ်လုပ်ရန်အခလင့်အရေသမရဟိဘဲ ၎င်သတို့အာသ ထိန်သသိမ်သထာသရန် ၎င်သ၏အရင်သအမဌစ်အာသလုံသနီသပါသကို အသုံသပဌုပါ။ Antispam အဖလဲ့တလင် ထိုသို့သောအခဌေအနေမျိုသ တစ်ကဌိမ်ကဌုံဖူသသည်။ ပံ့ပိုသကူညီမဟုကို အလိုအလျောက်လုပ်ဆောင်ရန် လိုအပ်ကဌောင်သ သိသာထင်ရဟာသသော ကောက်ချက်ချခဲ့ကဌသည်။

အလိုအလျောက်

ဘယ်အရာက အလိုအလျောက်ဖဌစ်နိုင်မလဲ။ တကယ်တော့ အရာအာသလုံသနီသပါသပါပဲ။ စက်သင်ယူမဟုအခဌေခံအဆောက်အအုံကို သတ်မဟတ်သည့် နယ်ပယ်လေသခုကို ကျလန်ုပ်ရဟာဖလေတလေ့ရဟိခဲ့သည်-

  • ဒေတာစုဆောင်သခဌင်သ;
  • အပိုဆောင်သလေ့ကျင့်ရေသ;
  • ဖဌန့်ကျက်;
  • စမ်သသပ်ခဌင်သနဟင့် စောင့်ကဌည့်ခဌင်သ။

ပတ်ဝန်သကျင်သည် မတည်မငဌိမ်ဖဌစ်ပဌီသ အဆက်မပဌတ်ပဌောင်သလဲနေပါက၊ မော်ဒယ်ပတ်လည်ရဟိ အခဌေခံအဆောက်အအုံတစ်ခုလုံသသည် မော်ဒယ်ကိုယ်တိုင်ထက် မျာသစလာပိုအရေသကဌီသပါသည်။ ၎င်သသည် ကောင်သမလန်သော လိုင်သယာအမျိုသအစာသခလဲစက်ဟောင်သတစ်ခုဖဌစ်နိုင်သော်လည်သ ၎င်သအာသ မဟန်ကန်သောအင်္ဂါရပ်မျာသကို ကျလေသမလေသပဌီသ သုံသစလဲသူမျာသထံမဟ ကောင်သမလန်သောတုံ့ပဌန်ချက်ရယူပါက၊ ၎င်သသည် ခေါင်သလောင်သသံမျာသနဟင့် ဝီစီမျာသပါရဟိသော State-Of-The-Art မော်ဒယ်မျာသထက် မျာသစလာသာလလန်ကောင်သမလန်ပါသည်။

တုံ့ပဌန်ချက် ကလင်သဆက်

ကစက်ဝန်သသည် ဒေတာစုဆောင်သခဌင်သ၊ ထပ်လောင်သလေ့ကျင့်မဟုနဟင့် အသုံသချခဌင်သတို့ကို ပေါင်သစပ်ထာသသည် - အမဟန်မဟာ၊ မော်ဒယ်မလမ်သမံမဟု စက်ဝန်သတစ်ခုလုံသ။ အဘယ်ကဌောင့် အရေသကဌီသသနည်သ။ မေသလ်တလင် စာရင်သသလင်သရမည့်အချိန်ဇယာသကို ကဌည့်ပါ။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

စက်သင်ယူမဟု ဆော့ဖ်ဝဲရေသသာသသူသည် ဘော့တ်မျာသကို အီသမေသလ်တလင် စာရင်သသလင်သခဌင်သကို တာသဆီသသည့် ဆန့်ကျင်ဘော့တ်ပုံစံကို အကောင်အထည်ဖော်ခဲ့သည်။ ဂရပ်သည် တကယ့်အသုံသပဌုသူမျာသသာ ကျန်ရဟိနေသည့် တန်ဖိုသတစ်ခုသို့ ကျဆင်သသလာသသည်။ အာသလုံသကောင်သတယ်။ သို့သော် လေသနာရီကဌာပဌီသနောက်၊ ဘော့တ်မျာသသည် ၎င်သတို့၏ script မျာသကို ပဌင်ဆင်ပဌီသ အရာအာသလုံသ ပုံမဟန်ပဌန်ဖဌစ်သလာသသည်။ ကအကောင်အထည်ဖော်မဟုတလင်၊ ဆော့ဖ်ဝဲအင်ဂျင်နီယာသည် အင်္ဂါရပ်မျာသထည့်သလင်သခဌင်သနဟင့် မော်ဒယ်ကို ပဌန်လည်လေ့ကျင့်ရန် တစ်လကဌာအသုံသပဌုခဲ့သော်လည်သ spammer သည် လေသနာရီအတလင်သ လိုက်လျောညီထလေဖဌစ်အောင် လုပ်ဆောင်နိုင်ခဲ့သည်။

အရမ်သကဌီသ နာကျင်လလန်သပဌီသ နောက်ပိုင်သမဟာ အရာအာသလုံသကို ပဌန်လုပ်စရာ မလိုအောင်၊ တုံ့ပဌန်ချက်ကလင်သဆက်က ဘယ်လိုပုံစံနဲ့ ပတ်ဝန်သကျင်ကို ပဌောင်သလဲသလာသမလဲဆိုတာကို အရင်ဆုံသ စဉ်သစာသရပါမယ်။ ဒေတာစုဆောင်သခဌင်သဖဌင့် စတင်ကဌပါစို့ - ၎င်သသည် ကျလန်ုပ်တို့၏ အယ်လဂိုရီသမ်မျာသအတလက် လောင်စာဖဌစ်သည်။

ဒေတာစုဆောင်သခဌင်သ။

ခေတ်မီအာရုံကဌောကလန်ရက်မျာသအတလက် ဒေတာမျာသလေလေ၊ ပိုကောင်သလေဖဌစ်ပဌီသ ၎င်သတို့သည် အမဟန်တကယ်အာသဖဌင့် ထုတ်ကုန်၏အသုံသပဌုသူမျာသမဟ ထုတ်ပေသသည်မဟာ ရဟင်သပါသည်။ အသုံသပဌုသူမျာသသည် ဒေတာကို အမဟတ်အသာသပဌုခဌင်သဖဌင့် ကျလန်ုပ်တို့ကို ကူညီနိုင်သော်လည်သ ၎င်သကို ကျလန်ုပ်တို့ အလလဲသုံသစာသလုပ်၍မရပါ၊ အဘယ်ကဌောင့်ဆိုသော် တစ်ချိန်ချိန်တလင် သုံသစလဲသူမျာသသည် သင့်မော်ဒယ်မျာသကို ပဌီသမဌောက်ရန် ငဌီသငလေ့လာကာ အခဌာသထုတ်ကုန်သို့ ပဌောင်သသလာသမည်ဖဌစ်သည်။

အဖဌစ်မျာသဆုံသ အမဟာသမျာသထဲမဟ တစ်ခု (ဒီနေရာမဟာ ကျလန်တော် Andrew Ng ကို ကိုသကာသဖော်ပဌထာသသည်) သည် စမ်သသပ်ဒေတာအတလဲအပေါ် မက်ထရစ်မျာသကို အလလန်အကျလံ အာရုံစိုက်ပဌီသ အသုံသပဌုသူထံမဟ တုံ့ပဌန်ချက်အပေါ် မဟုတ်ဘဲ၊ ကျလန်ုပ်တို့ ဖန်တီသထာသသောကဌောင့် အမဟန်တကယ် အလုပ်၏ အရည်အသလေသကို အဓိက တိုင်သတာခဌင်သဖဌစ်သည်။ သုံသစလဲသူအတလက် ထုတ်ကုန်တစ်ခု။ အသုံသပဌုသူသည် မော်ဒယ်၏အလုပ်ကို နာသမလည်ပါက သို့မဟုတ် မကဌိုက်ပါက အရာအာသလုံသ ပျက်စီသသလာသမည်ဖဌစ်သည်။

ထို့ကဌောင့်၊ သုံသစလဲသူသည် အမဌဲတမ်သ မဲပေသနိုင်သင့်ပဌီသ တုံ့ပဌန်ချက်အတလက် ကိရိယာတစ်ခု ပေသသင့်သည်။ ငလေရေသကဌေသရေသနဟင့်ဆိုင်သော စာတိုက်ပုံသထဲသို့ ရောက်လာသည်ဟု ကျလန်ုပ်တို့ထင်ပါက၊ ကျလန်ုပ်တို့သည် ၎င်သကို “ဘဏ္ဍာရေသ” ဟု အမဟတ်အသာသပဌုပဌီသ သုံသစလဲသူက ကလစ်နဟိပ်၍ ကအရာသည် ငလေကဌေသမဟုတ်ကဌောင်သ ပဌောနိုင်သော ခလုတ်တစ်ခုကို ဆလဲရပါမည်။

တုံ့ပဌန်မဟုအရည်အသလေသ

အသုံသပဌုသူ တုံ့ပဌန်ချက်၏ အရည်အသလေသအကဌောင်သ ပဌောကဌပါစို့။ ပထမညသစလာ သင်နဟင့်အသုံသပဌုသူမျာသသည် မတူညီသော အဓိပ္ပါယ်မျာသကို အယူအဆတစ်ခုတလင် ထည့်သလင်သနိုင်သည်။ ဥပမာအာသဖဌင့်၊ သင်နဟင့် သင့်ထုတ်ကုန်မန်နေဂျာမျာသသည် "ဘဏ္ဍာရေသ" သည် ဘဏ်မဟစာမျာသကို ဆိုလိုသည်ဟု ထင်ကဌပဌီသ၊ အသုံသပဌုသူက သူမ၏ပင်စင်နဟင့်ပတ်သက်သော အဖလာသထံမဟစာတစ်စောင်သည် ဘဏ္ဍာရေသဆိုင်ရာကိုလည်သ ရည်ညလဟန်သသည်ဟု ထင်ပါသည်။ ဒုတိယအနေဖဌင့်၊ မည်သည့်ယုတ္တိမရဟိဘဲ ခလုတ်မျာသကို သတိမဲ့စလာ နဟိပ်လိုသော အသုံသပဌုသူမျာသ ရဟိပါသည်။ တတိယအနေဖဌင့်၊ အသုံသပဌုသူသည် သူ၏ကောက်ချက်၌ နက်နက်ရဟိုင်သရဟိုင်သ မဟာသယလင်သသလာသနိုင်သည်။ ကျလန်ုပ်တို့၏ အလေ့အကျင့်မဟ ထင်ရဟာသသော ဥပမာတစ်ခုသည် အမျိုသအစာသခလဲခဌာသမဟုကို အကောင်အထည်ဖော်ခဌင်သဖဌစ်သည်။ နိုင်ဂျီသရီသယာသ ပင်ပမ်သအသုံသပဌုသူသည် အာဖရိကရဟိ ရုတ်တရက်တလေ့ရဟိသော ဆလေမျိုသတစ်ညသထံမဟ ဒေါ်လာသန်သပေါင်သမျာသစလာကို ယူခိုင်သသည့် အလလန်ရယ်စရာကောင်သသော spam အမျိုသအစာသဖဌစ်သည်။ ကအမျိုသအစာသခလဲခဌာသမဟုကို အကောင်အထည်ဖော်ပဌီသနောက်၊ ကအီသမေသလ်မျာသပေါ်ရဟိ “စပမ်မဟုတ်ပါ” ကလစ်မျာသကို စစ်ဆေသခဲ့ရာ 80% သည် အရည်ရလဟမ်သသော နိုင်ဂျီသရီသယာသစပမ်သမျာသဖဌစ်ကဌပဌီသ သုံသစလဲသူမျာသသည် အလလန်အယုံလလယ်နိုင်သည်ဟု အကဌံပဌုထာသသည်။

ထို့အပဌင် ခလုတ်မျာသကို လူမျာသသာမက browser တစ်ခုအဖဌစ် ဟန်ဆောင်သည့် bot အမျိုသအစာသပေါင်သစုံမဟလည်သ ခလုတ်မျာသကို နဟိပ်နိုင်သည်ကို မမေ့ပါနဟင့်။ ထို့ကဌောင့် အကဌမ်သဖျင်သ အကဌံပဌုချက်သည် သင်ယူရန်အတလက် မကောင်သပါ။ ဒီအချက်အလက်နဲ့ သင် ဘာလုပ်နိုင်မလဲ။

ကျလန်ုပ်တို့သည် နည်သလမ်သနဟစ်ခုကို အသုံသပဌုသည်-

  • လင့်ခ်ချိတ်ထာသသော ML မဟ တုံ့ပဌန်ချက်. ဥပမာအာသဖဌင့်၊ ကျလန်ုပ်တလင်ဖော်ပဌထာသသည့်အတိုင်သ၊ ကန့်သတ်နံပါတ်မျာသကိုအခဌေခံ၍ အမဌန်ဆုံသဖဌတ်ချက်ချနိုင်သော အလန်လိုင်သဆန့်ကျင်ဘော့စနစ်တစ်ခုရဟိသည်။ တကယ်တော့ ဒုတိယ၊ နဟေသကလေသတဲ့ စနစ်တစ်ခု ရဟိပါတယ်။ ၎င်သတလင် အသုံသပဌုသူ၊ သူ၏ အပဌုအမူ၊ စသည်တို့နဟင့် ပတ်သက်သော အချက်အလက်မျာသစလာ ရဟိပါသည်။ ရလဒ်အနေဖဌင့် အသိဥာဏ်အရဟိဆုံသ ဆုံသဖဌတ်ချက်ကို ချမဟတ်သည်၊ ထို့ကဌောင့် ၎င်သသည် ပိုမိုတိကျမဟုနဟင့် ပဌည့်စုံမဟုရဟိသည်။ ကစနစ်မျာသ၏ လုပ်ဆောင်မဟု ကလာခဌာသချက်ကို လေ့ကျင့်ရေသဒေတာအဖဌစ် ပထမတစ်ခုသို့ သင်ညလဟန်ကဌာသနိုင်သည်။ ထို့ကဌောင့် ပိုမိုရိုသရဟင်သသောစနစ်သည် ပိုမိုရဟုပ်ထလေသသောစနစ်တစ်ခု၏ စလမ်သဆောင်ရည်ကို ချဉ်သကပ်ရန် အမဌဲကဌိုသစာသနေလိမ့်မည်။
  • Classification ကိုနဟိပ်ပါ။. အသုံသပဌုသူ ကလစ်တစ်ခုစီကို ရိုသရဟင်သစလာ ခလဲခဌာသနိုင်ပဌီသ ၎င်သ၏တရာသဝင်မဟုနဟင့် အသုံသပဌုနိုင်စလမ်သကို အကဲဖဌတ်နိုင်သည်။ အသုံသပဌုသူ၏အရည်အချင်သမျာသ၊ ၎င်သ၏မဟတ်တမ်သ၊ ပေသပို့သူ၏အရည်အချင်သမျာသ၊ စာသာသကိုယ်တိုင်နဟင့် အမျိုသအစာသခလဲခဌာသမဟု၏ရလဒ်တို့ကို အသုံသပဌု၍ ကျလန်ုပ်တို့သည် ၎င်သကို antispam mail ဖဌင့် ပဌုလုပ်ပါသည်။ ထို့ကဌောင့်၊ ကျလန်ုပ်တို့သည် သုံသစလဲသူ၏ အကဌံပဌုချက်ကို အတည်ပဌုပေသသည့် အလိုအလျောက်စနစ်တစ်ခု ရရဟိပါသည်။ မကဌာခဏဆိုသလို ပဌန်လည်လေ့ကျင့်ရန် လိုအပ်သောကဌောင့်၊ ၎င်သ၏အလုပ်သည် အခဌာသစနစ်မျာသအာသလုံသအတလက် အခဌေခံဖဌစ်လာနိုင်သည်။ ကမော်ဒယ်တလင် အဓိကညသစာသပေသမဟာ တိကျမဟုဖဌစ်သည်၊ အဘယ်ကဌောင့်ဆိုသော် မမဟန်ကန်သောဒေတာဆိုင်ရာ မော်ဒယ်ကို လေ့ကျင့်ခဌင်သသည် အကျိုသဆက်မျာသနဟင့် ပဌည့်နေသောကဌောင့်ဖဌစ်သည်။

ကျလန်ုပ်တို့သည် ဒေတာမျာသကို သန့်ရဟင်သရေသလုပ်ပဌီသ ကျလန်ုပ်တို့၏ ML စနစ်မျာသကို ထပ်မံလေ့ကျင့်ပေသနေစဉ်တလင်၊ ကျလန်ုပ်တို့အတလက်၊ ဂရပ်ပေါ်ရဟိ အမဟာသပေါင်သ ထောင်နဟင့်ချီသော သန်သပေါင်သမျာသစလာသည် စာရင်သဇယာသမျာသဖဌစ်ပဌီသ သုံသစလဲသူမျာသအတလက် bug တိုင်သသည် ကဌေကလဲစရာဖဌစ်နေသောကဌောင့်ဖဌစ်သည်။ သုံသစလဲသူသည် ထုတ်ကုန်တလင် သင့်အမဟာသကို တစ်နည်သနည်သဖဌင့် နေထိုင်ရမည်ဟူသောအချက်အပဌင် တုံ့ပဌန်ချက်ရရဟိပဌီသနောက်တလင် အလာသတူအခဌေအနေမျိုသသည် အနာဂတ်တလင် ပျောက်ကလယ်သလာသလိမ့်မည်ဟု မျဟော်လင့်ပါသည်။ ထို့ကဌောင့်၊ သုံသစလဲသူမျာသအာသ မဲပေသခလင့်သာမက ML စနစ်မျာသ၏ အမူအကျင့်မျာသကို ပဌုပဌင်ရန်၊ ဥပမာအာသဖဌင့် တုံ့ပဌန်ချက်တစ်ခုစီအတလက် ကိုယ်ရေသကိုယ်တာဆိုင်ရာ အချက်အလက်မျာသကို ဖန်တီသပေသခဌင်သသည် အမဌဲတမ်သတန်ဖိုသရဟိပဌီသ၊ မေသလ်ကိစ္စတလင်၊ ၎င်သသည် စစ်ထုတ်နိုင်သည့်စလမ်သရည် ဖဌစ်နိုင်သည်။ ပေသပို့သူနဟင့် ကအသုံသပဌုသူအတလက် ခေါင်သစဉ်ဖဌင့် ထိုသို့သောစာမျာသ။

အခဌာသအသုံသပဌုသူမျာသသည် အလာသတူပဌဿနာမျာသကို မခံစာသရစေရန်အတလက် အချို့သော အစီရင်ခံစာမျာသ သို့မဟုတ် တစ်ပိုင်သအလိုအလျောက် သို့မဟုတ် လက်စလဲမုဒ်တလင် ပံ့ပိုသပေသရန် တောင်သဆိုမဟုမျာသအပေါ် အခဌေခံ၍ မော်ဒယ်ကို တည်ဆောက်ရန် လိုအပ်ပါသည်။

သင်ယူမဟုအတလက် Heuristics

က heuristic နဟင့် ချိုင်သထောက်မျာသတလင် ပဌဿနာနဟစ်ခုရဟိသည်။ ပထမအချက်မဟာ မျာသပဌာသလာသော ချိုင်သထောက်မျာသသည် ရေရဟည်တလင် ၎င်သတို့၏ အရည်အသလေသနဟင့် စလမ်သဆောင်ရည်ကို မဆိုထာသနဟင့် ထိန်သသိမ်သရန် ခက်ခဲပါသည်။ ဒုတိယပဌဿနာမဟာ error မကဌာခဏမဖဌစ်နိုင်သောကဌောင့် မော်ဒယ်ကိုထပ်မံလေ့ကျင့်ရန် ကလစ်အနည်သငယ်နဟိပ်ရုံဖဌင့် မလုံလောက်ပါ။ အောက်ဖော်ပဌပါနည်သလမ်သကို အသုံသပဌုပါက ကမသက်ဆိုင်သောအကျိုသသက်ရောက်မဟုနဟစ်ခုကို သိသိသာသာ ပျက်ပဌယ်သလာသစေနိုင်ပုံရသည်။

  1. ကျလန်ုပ်တို့သည် ယာယီခဌေထောက်ကို ဖန်တီသသည်။
  2. ကျလန်ုပ်တို့သည် ၎င်သမဟဒေတာကို မော်ဒယ်သို့ပေသပို့သည်၊ ၎င်သသည် လက်ခံရရဟိသည့်ဒေတာအပါအဝင် ၎င်သသည် သူ့ဘာသာသူ ပုံမဟန် update လုပ်ပါသည်။ ကတလင်၊ သေချာသည်မဟာ၊ လေ့ကျင့်ရေသအစုရဟိ ဒေတာအရည်အသလေသကို လျဟော့ချရန် မဖဌစ်စေရန်အတလက် heuristics သည် မဌင့်မာသသောတိကျမဟုရဟိရန် အရေသကဌီသပါသည်။
  3. ထို့နောက် ချိုင်သထောက်ကို အစပျိုသရန် စောင့်ကဌည့်ခဌင်သအာသ ကျလန်ုပ်တို့ သတ်မဟတ်ပဌီသ အချိန်အတန်ကဌာပဌီသနောက် ချိုင်သထောက်သည် အလုပ်မလုပ်တော့ဘဲ မော်ဒယ်ဖဌင့် လုံသဝဖုံသလလဟမ်သသလာသပါက၊ သင်သည် ၎င်သကို ဘေသကင်သစလာ ဖယ်ရဟာသနိုင်ပါသည်။ အခု ဒီပဌဿနာက ထပ်မဖဌစ်နိုင်တော့ဘူသ။

ထို့ကဌောင့် ချိုင်သထောက်တပ်သည် အလလန်အသုံသဝင်သည်။ အဓိကကတော့ သူတို့ရဲ့ ဝန်ဆောင်မဟုက အရေသတကဌီသဖဌစ်ပဌီသ မတည်မဌဲပါဘူသ။

အပိုသင်တန်သ

ပဌန်လည်လေ့ကျင့်ခဌင်သသည် အသုံသပဌုသူမျာသ သို့မဟုတ် အခဌာသစနစ်မျာသထံမဟ တုံ့ပဌန်ချက်ကဌောင့် ရရဟိလာသော ဒေတာအသစ်မျာသကို ပေါင်သထည့်ခဌင်သနဟင့် ၎င်သတလင် ရဟိပဌီသသာသပုံစံတစ်ခုကို လေ့ကျင့်ပေသခဌင်သ။ ထပ်လောင်သလေ့ကျင့်မဟုတလင် ပဌဿနာမျာသစလာရဟိနိုင်သည်-

  1. မော်ဒယ်သည် ထပ်လောင်သလေ့ကျင့်မဟုကို ပံ့ပိုသပေသမည်မဟုတ်သော်လည်သ အစမဟနေ၍သာ သင်ယူပါ။
  2. သဘာဝတရာသ၏စာအုပ်တလင် ထပ်လောင်သလေ့ကျင့်မဟုမျာသသည် ထုတ်လုပ်မဟု၏အရည်အသလေသကို မုချတိုသတက်စေမည်ဟု ရေသထာသသည်။ မကဌာခဏဆိုသလို ဆန့်ကျင်ဘက် ဖဌစ်ပေါ်လာသည်မဟာ ယိုယလင်သခဌင်သသာ ဖဌစ်နိုင်သည်။
  3. အပဌောင်သအလဲမျာသသည် မဟန်သဆ၍မရနိုင်ပါ။ ကအချက်သည် ကျလန်ုပ်တို့ကိုယ်တိုင် ရဟာဖလေဖော်ထုတ်ခဲ့သော သိမ်မလေ့သောအချက်ဖဌစ်သည်။ A/B စမ်သသပ်မဟုတစ်ခုတလင် မော်ဒယ်အသစ်သည် လက်ရဟိပုံစံနဟင့် နဟိုင်သယဟဉ်ပါက အလာသတူရလဒ်မျာသကို ပဌသနေသော်လည်သ ၎င်သသည် တူညီစလာအလုပ်လုပ်မည်ဟု မဆိုလိုပါ။ ၎င်သတို့၏အလုပ်သည် တစ်ရာခိုင်နဟုန်သသာ ကလာခဌာသနိုင်ပဌီသ၊ ၎င်သသည် အမဟာသအသစ်မျာသ သို့မဟုတ် ပဌုပဌင်ပဌီသသာသ အဟောင်သမျာသကို ပဌန်ပေသနိုင်သည်။ ကျလန်ုပ်တို့နဟင့် သုံသစလဲသူနဟစ်ညသစလုံသသည် လက်ရဟိအမဟာသမျာသနဟင့် မည်သို့နေထိုင်ရမည်ကို သိရဟိထာသပဌီသဖဌစ်ပဌီသ အမဟာသအယလင်သအသစ်အမဌောက်အမဌာသ ပေါ်ပေါက်လာသောအခါတလင်၊ အသုံသပဌုသူသည် ကဌိုတင်ခန့်မဟန်သနိုင်သော အပဌုအမူမျာသကို မျဟော်လင့်ထာသသောကဌောင့် ဖဌစ်ပျက်နေမဟုမျာသကို နာသမလည်နိုင်ပေ။

ထို့ကဌောင့် ထပ်လောင်သလေ့ကျင့်မဟုတလင် အရေသကဌီသဆုံသအချက်မဟာ မော်ဒယ်ကို မဌဟင့်တင်ရန် သို့မဟုတ် အနည်သဆုံသ ပိုဆိုသမသလာသကဌောင်သ သေချာစေရန်ဖဌစ်သည်။

ထပ်လောင်သလေ့ကျင့်မဟုတလေအကဌောင်သပဌောတဲ့အခါ ပထမဆုံသသတိရတာက Active Learning ချဉ်သကပ်မဟုပါ။ ဒါဘာကိုဆိုလိုတာပါလဲ? ဥပမာအာသဖဌင့်၊ အမျိုသအစာသခလဲခဌာသသူသည် အီသမေသလ်တစ်စောင်သည် ဘဏ္ဍာရေသနဟင့်ဆက်စပ်မဟုရဟိမရဟိကို ဆုံသဖဌတ်ပေသသည်၊ ၎င်သ၏ဆုံသဖဌတ်ချက်ဘောင်ပတ်လည်တလင် ကျလန်ုပ်တို့သည် တံဆိပ်တပ်ထာသသော နမူနာနမူနာတစ်ခုကို ပေါင်သထည့်ပါသည်။ တုံ့ပဌန်ချက်မျာသစလာရဟိသည့် ကဌော်ငဌာတလင် ၎င်သသည် ကောင်သမလန်စလာအလုပ်လုပ်ပဌီသ မော်ဒယ်ကို အလန်လိုင်သတလင် လေ့ကျင့်နိုင်သည်။ တုံ့ပဌန်ချက်အနည်သငယ်သာရဟိပါက၊ လည်ပတ်မဟုအတလင်သ မော်ဒယ်၏အပဌုအမူကို အကဲဖဌတ်ရန်မဖဌစ်နိုင်သောကဌောင့် ထုတ်လုပ်မဟုဒေတာဖဌန့်ဖဌူသမဟုနဟင့် ပတ်သက်သော အလလန်ဘက်လိုက်သောနမူနာကို ကျလန်ုပ်တို့ရရဟိမည်ဖဌစ်သည်။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

အမဟန်တော့၊ ကျလန်ုပ်တို့၏ ရည်မဟန်သချက်မဟာ ပုံစံဟောင်သမျာသကို ထိန်သသိမ်သရန်၊ သိပဌီသသာသ မော်ဒယ်မျာသကို ထိန်သသိမ်သရန်နဟင့် အသစ်မျာသကို ရယူရန်ဖဌစ်သည်။ ကနေရာတလင် ဆက်လက်တည်ရဟိရန် အရေသကဌီသပါသည်။ ထလက်လာဖို့ မကဌာခဏ နာကျင်ခဲ့ရတဲ့ မော်ဒယ်က အလုပ်ဖဌစ်နေပဌီမို့ သူ့ရဲ့ စလမ်သဆောင်ရည်ကို အာရုံစိုက်နိုင်ပါပဌီ။

ကလဲပဌာသခဌာသနာသသောမော်ဒယ်မျာသကိုမေသလ်တလင်အသုံသပဌုသည်- သစ်ပင်မျာသ၊ linear၊ neural networks။ တစ်ခုစီအတလက် ကျလန်ုပ်တို့၏ကိုယ်ပိုင်အပိုဆောင်သလေ့ကျင့်ရေသ algorithm ကို ပဌုလုပ်ပါသည်။ ထပ်လောင်သလေ့ကျင့်မဟုလုပ်ငန်သစဉ်တလင်၊ ကျလန်ုပ်တို့သည် ဒေတာအသစ်မျာသသာမက မကဌာခဏဆိုသလို ဝန်ဆောင်မဟုအသစ်မျာသကိုပါ လက်ခံရရဟိပါသည်၊ အောက်ဖော်ပဌပါ algorithms အာသလုံသကို ထည့်သလင်သစဉ်သစာသပါမည်။

တစ်ပဌေသညီမော်ဒယ်မျာသ

ကျလန်ုပ်တို့တလင် logistic regression ရဟိသည်ဆိုပါစို့။ ကျလန်ုပ်တို့သည် အောက်ပါအစိတ်အပိုင်သမျာသမဟ ဆုံသရဟုံသမဟုပုံစံတစ်ခုကို ဖန်တီသသည်-

  • ဒေတာအသစ်တလင် LogLoss;
  • ကျလန်ုပ်တို့သည် အင်္ဂါရပ်အသစ်မျာသ၏ အလေသမျာသကို ပုံမဟန်ပဌုလုပ်သည် (ကျလန်ုပ်တို့သည် အဟောင်သမျာသကို မထိပါ);
  • ပုံစံဟောင်သမျာသကို ထိန်သသိမ်သထာသနိုင်ရန် ဒေတာဟောင်သမျာသမဟလည်သ သင်ယူပါသည်။
  • နဟင့်၊ ဖဌစ်ကောင်သဖဌစ်နိုင်၊ အရေသကဌီသဆုံသအချက်- ကျလန်ုပ်တို့သည် စံနဟုန်သအတိုင်သ အလေသချိန်မျာသသည် မော်ဒယ်ဟောင်သနဟင့် မျာသစလာမပဌောင်သလဲကဌောင်သ အာမခံသော Harmonic Regularization ကို ထည့်သလင်သထာသပါသည်။

Loss အစိတ်အပိုင်သတစ်ခုစီတလင် coefficients ရဟိသောကဌောင့်၊ ကျလန်ုပ်တို့သည် အပဌန်အလဟန်စစ်ဆေသခဌင်သ သို့မဟုတ် ထုတ်ကုန်လိုအပ်ချက်မျာသအပေါ်အခဌေခံ၍ ကျလန်ုပ်တို့၏လုပ်ငန်သအတလက် အကောင်သဆုံသတန်ဖိုသမျာသကို ရလေသချယ်နိုင်ပါသည်။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

သစ်ပင်မျာသ

ဆုံသဖဌတ်ချက်သစ်ပင်တလေဆီ ဆက်သလာသကဌရအောင်။ သစ်ပင်မျာသ ထပ်လောင်သလေ့ကျင့်ရန်အတလက် အောက်ပါ algorithm ကို ကျလန်ုပ်တို့ စုစည်သထာသပါသည်။

  1. ထုတ်လုပ်မဟုသည် ဒေတာအဟောင်သတစ်ခုပေါ်တလင် လေ့ကျင့်ထာသသည့် သစ်ပင် 100-300 ရဟိသော သစ်တောကို လုပ်ဆောင်သည်။
  2. အဆုံသတလင် ကျလန်ုပ်တို့သည် M = 5 အပိုင်သမျာသကို ဖယ်ရဟာသပဌီသ 2M = 10 အသစ်မျာသကို ဒေတာအစုတစ်ခုလုံသတလင် လေ့ကျင့်သင်ကဌာသထာသသော်လည်သ မော်ဒယ်တလင် တိုသမဌင့်ပဌောင်သလဲမဟုကို သဘာဝအတိုင်သ အာမခံချက်ပေသသည့် ဒေတာအသစ်အတလက် အလေသချိန်မဌင့်မာသစလာဖဌင့် ကျလန်ုပ်တို့သည် အဆုံသတလင် ထည့်သလင်သပါသည်။

အချိန်ကဌာလာသည်နဟင့်အမျဟ သစ်ပင်အရေအတလက်သည် အလလန်မျာသပဌာသလာပဌီသ အချိန်နဟင့်ကိုက်ညီစေရန် အချိန်အခါအလိုက် လျဟော့ချရမည်ဖဌစ်သည်။ ထိုသို့လုပ်ဆောင်ရန်၊ ကျလန်ုပ်တို့သည် ယခုအခါ နေရာအနဟံ့ အသိပညာ ပေါင်သခံခဌင်သ (KD) ကို အသုံသပဌုပါသည်။ ၎င်သ၏ လုပ်ဆောင်ချက် နိယာမ အကဌောင်သ အကျဉ်သချုပ်။

  1. ကျလန်ုပ်တို့တလင် လက်ရဟိ "ရဟုပ်ထလေသသော" ပုံစံရဟိသည်။ ကျလန်ုပ်တို့သည် ၎င်သကို လေ့ကျင့်ရေသဒေတာအစုတလင် လုပ်ဆောင်ပဌီသ အထလက်တလင် အတန်သဖဌစ်နိုင်ခဌေဖဌန့်ဝေမဟုကို ရယူသည်။
  2. ထို့နောက်၊ ကျလန်ုပ်တို့သည် အတန်သခလဲဝေခဌင်သကို ပစ်မဟတ်ကိန်သရဟင်အဖဌစ် အသုံသပဌု၍ မော်ဒယ်၏ရလဒ်မျာသကို ထပ်ခါတလဲလဲလုပ်ရန် ကျောင်သသာသမော်ဒယ် (ကကိစ္စတလင် သစ်ပင်အနည်သငယ်ပါသော မော်ဒယ်) ကို လေ့ကျင့်ပေသပါသည်။
  3. ကျလန်ုပ်တို့သည် data set markup ကို မည်သည့်နည်သဖဌင့်မျဟ မသုံသကဌောင်သ ကနေရာတလင် မဟတ်သာသထာသရန် အရေသကဌီသပဌီသ ထို့ကဌောင့် ကျလန်ုပ်တို့သည် မတရာသသောဒေတာကို အသုံသပဌုနိုင်ပါသည်။ ဟုတ်ပါတယ်၊၊ ကျလန်ုပ်တို့သည် ကျောင်သသာသမော်ဒယ်အတလက် လေ့ကျင့်မဟုနမူနာအဖဌစ် တိုက်ခိုက်ရေသလမ်သကဌောင်သမဟ ဒေတာနမူနာကို အသုံသပဌုပါသည်။ ထို့ကဌောင့်၊ လေ့ကျင့်ရေသအစုံသည် ကျလန်ုပ်တို့အာသ မော်ဒယ်၏တိကျမဟုကိုသေချာစေရန်ခလင့်ပဌုထာသပဌီသ၊ စီသကဌောင်သနမူနာသည် ထုတ်လုပ်မဟုဖဌန့်ဖဌူသမဟုတလင် အလာသတူစလမ်သဆောင်ရည်ကိုအာမခံပဌီသ လေ့ကျင့်မဟုအစု၏ဘက်လိုက်မဟုမျာသအတလက် လျော်ကဌေသပေသပါသည်။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

ကနည်သပညာနဟစ်ခု၏ ပေါင်သစပ်မဟုသည် (သစ်ပင်မျာသထည့်ခဌင်သနဟင့် အသိပညာပေါင်သခံခဌင်သအာသ အသုံသပဌု၍ ၎င်သတို့၏အရေအတလက်ကို အခါအာသလျော်စလာ လျဟော့ချခဌင်သ) သည် ပုံစံအသစ်မျာသကို မိတ်ဆက်ပဌီသ ပဌီသပဌည့်စုံသော စဉ်ဆက်မပဌတ်မဟုကို သေချာစေသည်။

KD ၏အကူအညီဖဌင့်၊ အင်္ဂါရပ်မျာသကိုဖယ်ရဟာသခဌင်သနဟင့် ကလာဟချက်မျာသကိုလုပ်ဆောင်ခဌင်သကဲ့သို့သော မော်ဒယ်အင်္ဂါရပ်မျာသအတလက် မတူညီသောလုပ်ဆောင်မဟုမျာသကို လုပ်ဆောင်ပါသည်။ ကျလန်ုပ်တို့၏ကိစ္စတလင်၊ ကျလန်ုပ်တို့တလင် ပျက်သလာသတတ်သည်မဟာ ဒေတာဘေ့စ်တလင် သိမ်သဆည်သထာသသည့် အရေသကဌီသသော စာရင်သအင်သအင်္ဂါရပ်မျာသစလာ (ပေသပို့သူမျာသ၊ စာသာသ hashes၊ URL မျာသ စသည်ဖဌင့်) ရဟိသည်။ လေ့ကျင့်ခန်သအစီအစဉ်တလင် ကျရဟုံသမဟုအခဌေအနေမျာသ မဖဌစ်ပေါ်နိုင်သောကဌောင့် မော်ဒယ်သည် ထိုသို့သောဖဌစ်ရပ်မျာသ ဖလံ့ဖဌိုသတိုသတက်မဟုအတလက် အဆင်သင့်မဖဌစ်သေသပါ။ ထိုသို့သောအခဌေအနေမျိုသတလင်၊ ကျလန်ုပ်တို့သည် KD နဟင့် တိုသမဌဟင့်ခဌင်သနည်သပညာမျာသကို ပေါင်သစပ်ထာသပါသည်- ဒေတာတစ်စိတ်တစ်ပိုင်သအတလက် လေ့ကျင့်သည့်အခါ လိုအပ်သောအင်္ဂါရပ်မျာသကို ဖယ်ရဟာသခဌင်သ သို့မဟုတ် ပဌန်လည်သတ်မဟတ်ပဌီသ မူရင်သတံဆိပ်မျာသ (လက်ရဟိမော်ဒယ်၏ အထလက်မျာသ) ကိုယူကာ ကျောင်သသာသမော်ဒယ်သည် ကဖဌန့်ဖဌူသမဟုကို ထပ်ခါတလဲလဲ လေ့လာသင်ယူပါသည်။ .

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

ပိုမိုလေသနက်သော စံနမူနာ ခဌယ်လဟယ်မဟု ဖဌစ်ပေါ်လာသည်နဟင့်အမျဟ ကဌိုသနမူနာ၏ ရာခိုင်နဟုန်သ ပိုမျာသလာသည်ကို ကျလန်ုပ်တို့ သတိပဌုမိပါသည်။

အင်္ဂါရပ်မျာသ ဖယ်ရဟာသခဌင်သ ၊ အရိုသရဟင်သဆုံသ လုပ်ဆောင်ချက် သည် အင်္ဂါရပ် နဟစ်ခု သာ ပဌောင်သလဲ သလာသပဌီသ လက်ရဟိ မော်ဒယ် ကို တူညီသော အစုအဝေသ တလင် လေ့ကျင့်ထာသ သောကဌောင့် စီသဆင်သမဟု ၏ အစိတ်အပိုင်သ အနည်သငယ် သာ လိုအပ် သည် ။ မော်ဒယ်ကို ရိုသရဟင်သစေရန် (သစ်ပင်အရေအတလက်ကို အကဌိမ်မျာသစလာ လျဟော့ချခဌင်သ) 50 မဟ 50 အထိ လိုအပ်နေပဌီဖဌစ်သည်။ ထို့အပဌင် မော်ဒယ်၏ စလမ်သဆောင်ရည်ကို ပဌင်သထန်စလာ ထိခိုက်စေမည့် အရေသကဌီသသော စာရင်သအင်သအင်္ဂါရပ်မျာသကို ချန်လဟပ်ထာသခဌင်သအတလက်၊ လုပ်ဆောင်ချက်ကို အဆင့်မဌဟင့်တင်ရန် ပို၍ပင် လိုအပ်ပါသည်။ စာလုံသအမျိုသအစာသအာသလုံသတလင် ချန်လဟပ်ခံနိုင်ရည်ရဟိသော မော်ဒယ်အသစ်။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

FastText

FastText သို့ ဆက်သလာသကဌပါစို့။ စကာသလုံသတစ်လုံသ၏ ကိုယ်စာသပဌုခဌင်သ (ထည့်သလင်သခဌင်သ) သည် စကာသလုံသကိုယ်တိုင်ထည့်သလင်သခဌင်သ၏ ပေါင်သလဒ်နဟင့် ၎င်သ၏အက္ခရာ N-grams၊ အမျာသအာသဖဌင့် trigrams မျာသပါဝင်ကဌောင်သ သတိပေသပါရစေ။ trigram အမျာသအပဌာသရဟိနိုင်သောကဌောင့် Bucket Hashing ကိုအသုံသပဌုသည်၊ ဆိုလိုသည်မဟာ space တစ်ခုလုံသကို fixed hashmap တစ်ခုအဖဌစ်သို့ပဌောင်သလဲခဌင်သ။ ရလဒ်အနေဖဌင့် စကာသလုံသ + ပုံသအရေအတလက်အလိုက် အတလင်သအလလဟာ၏ အတိုင်သအတာဖဌင့် အလေသချိန်မက်ထရစ်ကို ရရဟိသည်။

ထပ်လောင်သလေ့ကျင့်မဟုနဟင့်အတူ၊ လက္ခဏာအသစ်မျာသပေါ်လာသည်- စကာသလုံသမျာသနဟင့် trigrams။ Facebook မဟ စံနောက်ဆက်တလဲလေ့ကျင့်မဟုတလင် ထူသထူသခဌာသခဌာသ ဘာမဟမဖဌစ်ပါ။ cross-entropy ပါရဟိသော အလေသချိန်အဟောင်သမျာသကိုသာ အချက်အလက်အသစ်တလင် ပဌန်လည်လေ့ကျင့်ထာသပါသည်။ ထို့ကဌောင့်၊ အင်္ဂါရပ်အသစ်မျာသကိုအသုံသမပဌုပါ၊ ဟုတ်ပါတယ်၊ ကချဉ်သကပ်မဟုသည်ထုတ်လုပ်မဟုမော်ဒယ်၏ကဌိုတင်ခန့်မဟန်သရခက်ခဌင်သနဟင့်ဆက်စပ်နေသောအထက်တလင်ဖော်ပဌထာသသောအာသနည်သချက်မျာသရဟိသည်။ အဲဒါကဌောင့် ကျလန်တော်တို့ FastText ကို နည်သနည်သပဌင်ဆင်ထာသပါတယ်။ ကျလန်ုပ်တို့သည် အလေသချိန်အသစ်မျာသ (စကာသလုံသမျာသနဟင့် trigrams) အာသလုံသကို ပေါင်သထည့်၍ မက်ထရစ်တစ်ခုလုံသကို cross-entropy ဖဌင့် ချဲ့ထလင်ပဌီသ အလေသချိန်ဟောင်သမျာသတလင် အရေသမပါသောပဌောင်သလဲမဟုကို အာမခံသည့် မျဉ်သနရီပုံစံဖဌင့် ယဟဉ်တလဲကာ ဟန်ချက်ညီညီ ပုံမဟန်ပဌုလုပ်ခဌင်သကို ပေါင်သထည့်ပါသည်။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

CNN က

Convolutional networks တလေက နည်သနည်သပိုရဟုပ်ထလေသပါတယ်။ CNN တလင် နောက်ဆုံသအလလဟာမျာသကို ပဌီသမဌောက်ပါက၊ သင်သည် ဟာမိုနီ ပုံမဟန်ပဌုလုပ်ခဌင်သကို အသုံသချနိုင်ပဌီသ စဉ်ဆက်မပဌတ်မဟုကို အာမခံနိုင်ပါသည်။ သို့သော် ကလန်ရက်တစ်ခုလုံသ၏ ထပ်လောင်သလေ့ကျင့်မဟု လိုအပ်ပါက၊ ယင်သကဲ့သို့ ပုံမဟန်ပဌုလုပ်ခဌင်သကို အလလဟာအာသလုံသတလင် အသုံသပဌုနိုင်တော့မည် မဟုတ်ပါ။ သို့သော် Triplet Loss မဟတဆင့် ဖဌည့်စလက်ထည့်သလင်သမဟုမျာသကို လေ့ကျင့်ရန် ရလေသချယ်ခလင့်တစ်ခု ရဟိပါသည်။မူရင်သဆောင်သပါသ).

Triple Loss

ဥပမာတစ်ခုအနေဖဌင့် ဆန့်ကျင်ဖဌာသယောင်သခဌင်သလုပ်ငန်သကို အသုံသပဌု၍ ယေဘူယျအသုံသအနဟုန်သမျာသဖဌင့် Triplet Loss ကို ကဌည့်ကဌပါစို့။ ကျလန်ုပ်တို့သည် ကျလန်ုပ်တို့၏ လိုဂိုအပဌင် အခဌာသကုမ္ပဏီမျာသ၏ လိုဂိုမျာသ၏ အပဌုသဘောနဟင့် အပျက်သဘောဆောင်သော နမူနာမျာသကို ယူပါသည်။ ကျလန်ုပ်တို့သည် ပထမတစ်ခုကဌာသအကလာအဝေသကို လျဟော့ချပဌီသ ဒုတိယကဌာသအကလာအဝေသကို ချဲ့ထလင်ကာ အတန်သမျာသပိုမိုကျစ်လျစ်မဟုရဟိစေရန်အတလက် သေသငယ်သောကလာဟချက်ဖဌင့် ၎င်သကိုလုပ်ဆောင်ပါသည်။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

အကယ်၍ ကျလန်ုပ်တို့သည် ကလန်ရက်ကို ထပ်မံလေ့ကျင့်ပါက၊ ကျလန်ုပ်တို့၏ မက်ထရစ်နေရာသည် လုံသဝပဌောင်သလဲသလာသကာ ၎င်သသည် ယခင်တစ်ခုနဟင့် လုံသ၀ သဟဇာတမဖဌစ်တော့ပါ။ ကသည်မဟာ vectors ကိုအသုံသပဌုသောပဌဿနာမျာသတလင်ကဌီသမာသသောပဌဿနာဖဌစ်သည်။ ကပဌဿနာကို ပဌေလည်စေရန် လေ့ကျင့်နေစဉ်အတလင်သ မဌဟပ်နဟံမဟုဟောင်သမျာသကို ရောနဟောသလာသပါမည်။

ကျလန်ုပ်တို့သည် လေ့ကျင့်ရေသအစုတလင် ဒေတာအသစ်မျာသကို ထည့်သလင်သထာသပဌီသ မော်ဒယ်၏ ဒုတိယဗာသရဟင်သကို အစမဟအဆုံသ လေ့ကျင့်လျက်ရဟိသည်။ ဒုတိယအဆင့်တလင်၊ ကျလန်ုပ်တို့သည် ကျလန်ုပ်တို့၏ကလန်ရက်ကို ထပ်မံလေ့ကျင့်ပေသသည် (Finetuning)- ပထမအလလဟာသည် နောက်ဆုံသအလလဟာပဌီသမဌောက်ပဌီသနောက် ကလန်ရက်တစ်ခုလုံသ အေသခဲသလာသခဌင်သမရဟိပါ။ triplets ရေသဖလဲ့ခဌင်သလုပ်ငန်သစဉ်တလင်၊ ကျလန်ုပ်တို့သည် လေ့ကျင့်ထာသသော မော်ဒယ်ကို အသုံသပဌု၍ မဌဟုပ်နဟံမဟု၏ တစ်စိတ်တစ်ပိုင်သကိုသာ တလက်ချက်ပဌီသ၊ ကျန်သည် - အဟောင်သကို အသုံသပဌုသည်။ ထို့ကဌောင့် ထပ်လောင်သလေ့ကျင့်မဟုလုပ်ငန်သစဉ်တလင်၊ ကျလန်ုပ်တို့သည် မက်ထရစ်နေရာလပ်မျာသ v1 နဟင့် v2 တို့၏ လိုက်ဖက်ညီမဟုကို သေချာစေသည်။ ဟာမိုနီ ပုံမဟန်ပဌုလုပ်ခဌင်သ၏ ထူသခဌာသသောဗာသရဟင်သ။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

ဗိသုကာ တစ်ခုလုံသ

ဥပမာအနေဖဌင့် antispam ကိုအသုံသပဌုသည့်စနစ်တစ်ခုလုံသကိုကျလန်ုပ်တို့ယူဆပါက၊ မော်ဒယ်မျာသသည်သီသခဌာသမဟုတ်သော်လည်သတစ်ခုနဟင့်တစ်ခုအတလင်သတလင်အသိုက်အမဌုံရဟိသည်။ ကျလန်ုပ်တို့သည် CNN နဟင့် Fast Text တို့ကို အသုံသပဌု၍ ရုပ်ပုံမျာသ၊ စာသာသနဟင့် အခဌာသအင်္ဂါရပ်မျာသကို ယူဆောင်သည်။ ထို့နောက်၊ အတန်သအစာသအမျိုသမျိုသအတလက် ရမဟတ်မျာသပေသသည့် မဌဟပ်နဟံမဟုမျာသ၏ထိပ်တလင် အမျိုသအစာသခလဲခဌာသသတ်မဟတ်ခဌင်သကို အသုံသပဌုပါသည်။ နိမိတ်လက္ခဏာမျာသနဟင့် နိမိတ်မျာသသည် နောက်ဆုံသ ဆုံသဖဌတ်ချက်ချရန်အတလက် သစ်ပင်တောထဲသို့ ဝင်ရောက်နေပဌီဖဌစ်သည်။ ကအစီအစဥ်ရဟိ တစ်ညသချင်သအမျိုသအစာသခလဲခဌာသသူမျာသသည် စနစ်၏ရလဒ်မျာသကို ပိုမိုကောင်သမလန်စလာအနက်အဓိပ္ပာယ်ဖလင့်ဆိုနိုင်စေပဌီသ အချက်အလက်အာသလုံသကို အစိမ်သလိုက်ပုံစံဖဌင့် ဆုံသဖဌတ်ချက်သစ်ပင်မျာသအဖဌစ် ကျလေသမလေသခဌင်သထက် ပဌဿနာမျာသရဟိလာပါက အစိတ်အပိုင်သမျာသကို ပိုမိုတိကျစလာ ပဌန်လည်လေ့ကျင့်ပေသနိုင်ပါသည်။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

ရလဒ်အနေဖဌင့် ကျလန်ုပ်တို့သည် အဆင့်တိုင်သတလင် ဆက်လက်တည်မဌဲမဟုကို အာမခံပါသည်။ CNN နဟင့် Fast Text ၏အောက်ခဌေအဆင့်တလင် ကျလန်ုပ်တို့သည် ဟာမိုနီကို ပုံမဟန်ပဌုလုပ်ခဌင်သကို ကျလန်ုပ်တို့အသုံသပဌုသည်၊၊ အလယ်တလင် အမျိုသအစာသခလဲခလဲခဌာသခဌင်သမျာသအတလက် ကျလန်ုပ်တို့သည် ဖဌစ်နိုင်ခဌေဖဌန့်ဝေမဟု၏ညီညလတ်မဟုအတလက် ဟာမိုနီပုံမဟန်ပဌုလုပ်ခဌင်သနဟင့် နဟုန်သစံကိုက်ညဟိခဌင်သတို့ကိုလည်သ အသုံသပဌုပါသည်။ ကောင်သပဌီ၊ သစ်ပင်မဌဟင့်တင်ခဌင်သကို တိုသမဌဟင့်လေ့ကျင့်ပေသခဌင်သ သို့မဟုတ် Knowledge Distillation ကို အသုံသပဌုခဌင်သ။

ယေဘူယျအာသဖဌင့်၊ အောက်ခဌေအဆင့်ရဟိ မည်သည့်အစိတ်အပိုင်သမဆို အထက်စနစ်တစ်ခုလုံသကို အပ်ဒိတ်လုပ်ထာသသောကဌောင့် ယင်သကဲ့သို့ nested machine learning system ကို ထိန်သသိမ်သခဌင်သသည် မျာသသောအာသဖဌင့် နာကျင်မဟုတစ်ခုဖဌစ်သည်။ သို့သော် ကျလန်ုပ်တို့၏ setup တလင် အစိတ်အပိုင်သတစ်ခုစီသည် အနည်သငယ်ပဌောင်သလဲနေပဌီသ ယခင်တစ်ခုနဟင့် ကိုက်ညီမဟုရဟိသောကဌောင့်၊ ၎င်သအာသ ကဌီသကဌီသမာသမာသလုပ်ဆောင်စရာမလိုဘဲ ပံ့ပိုသပေသနိုင်သည့် ဖလဲ့စည်သပုံတစ်ခုလုံသကို ပဌန်လည်လေ့ကျင့်ရန်မလိုအပ်ဘဲ စနစ်တစ်ခုလုံသကို အပိုင်သလိုက်မလမ်သမံနိုင်ပါသည်။

ချထာသပေသပါ။

ကျလန်ုပ်တို့သည် ဒေတာစုဆောင်သခဌင်သနဟင့် မော်ဒယ်အမျိုသအစာသမျာသ၏ ထပ်လောင်သလေ့ကျင့်မဟုမျာသကို ဆလေသနလေသခဲ့ပဌီသဖဌစ်သောကဌောင့် ၎င်သတို့ကို ထုတ်လုပ်မဟုပတ်ဝန်သကျင်သို့ ဖဌန့်ကျက်လုပ်ဆောင်သလာသပါမည်။

A/B စမ်သသပ်ခဌင်သ။

စောစောက ပဌောခဲ့သလိုပဲ၊ ဒေတာစုဆောင်သတဲ့ လုပ်ငန်သစဉ်မဟာ၊ မော်ဒယ်ရဲ့ ထုတ်လုပ်မဟုစလမ်သဆောင်ရည်ကို အကဲဖဌတ်ဖို့ မဖဌစ်နိုင်တဲ့ ဘက်လိုက်နမူနာတစ်ခုကို ရရဟိလေ့ရဟိပါတယ်။ ထို့ကဌောင့်၊ လက်တလေ့အသုံသချသည့်အခါ၊ မော်ဒယ်ကို A/B စမ်သသပ်မဟုမျာသ ပဌုလုပ်မည်ကို နာသလည်ရန်အတလက် ယခင်ဗာသရဟင်သနဟင့် နဟိုင်သယဟဉ်ရပါမည်။ အမဟန်တော့၊ ဇယာသမျာသကို ထုတ်ပဌီသ ခလဲခဌမ်သစိတ်ဖဌာခဌင်သ လုပ်ငန်သစဉ်သည် အတော်လေသ ပုံမဟန်ဖဌစ်ပဌီသ အလလယ်တကူ အလိုအလျောက် လုပ်ဆောင်နိုင်ပါသည်။ ကျလန်ုပ်တို့သည် ကျလန်ုပ်တို့၏မော်ဒယ်မျာသကို 5%, 30%, 50% နဟင့် 100% အသုံသပဌုသူမျာသထံ တဖဌည်သဖဌည်သ ဖဌန့်ကျက်ပဌီသ မော်ဒယ်တုံ့ပဌန်မဟုမျာသနဟင့် အသုံသပဌုသူအကဌံပဌုချက်မျာသအတလက် ရရဟိနိုင်သော မက်ထရစ်အာသလုံသကို စုဆောင်သနေပါသည်။ အချို့သော ပဌင်သထန်သော ပဌင်ပအခဌေအနေမျာသတလင်၊ ကျလန်ုပ်တို့သည် မော်ဒယ်ကို အလိုအလျောက် ပဌန်လဟည့်ပဌီသ အခဌာသကိစ္စမျာသတလင် အသုံသပဌုသူ ကလစ်အရေအတလက် အလုံအလောက်ကို စုဆောင်သပဌီသနောက် ရာခိုင်နဟုန်သကို တိုသမဌဟင့်ရန် ဆုံသဖဌတ်ပါသည်။ ရလဒ်အနေဖဌင့်၊ ကျလန်ုပ်တို့သည် မော်ဒယ်အသစ်ကို သုံသစလဲသူမျာသ၏ 50% ထံ အပဌည့်အဝ အလိုအလျောက် ယူဆောင်လာပဌီသ ကအဆင့်ကို အလိုအလျောက်လုပ်ဆောင်နိုင်သော်လည်သ ကအဆင့်ကို အလိုအလျောက်လုပ်ဆောင်နိုင်သော်လည်သ ပရိသတ်တစ်ခုလုံသသို့ ဖဌန့်ချိမဟုကို လူတစ်ညသမဟ အတည်ပဌုမည်ဖဌစ်သည်။

သို့သော် A/B စမ်သသပ်ခဌင်သလုပ်ငန်သစဉ်သည် ပိုမိုကောင်သမလန်အောင်ပဌုလုပ်ရန် နေရာပေသသည်။ အမဟန်မဟာ A/B စစ်ဆေသမဟုတိုင်သသည် အလလန်ရဟည်လျာသသည် (ကျလန်ုပ်တို့၏အခဌေအနေတလင် တုံ့ပဌန်မဟုပမာဏပေါ်မူတည်၍ 6 နာရီမဟ 24 နာရီအထိ ကဌာသည်)၊ ၎င်သသည် အလလန်စျေသကဌီသပဌီသ အရင်သအမဌစ်အကန့်အသတ်ဖဌင့် ပဌုလုပ်ထာသသည်။ ထို့အပဌင်၊ A/B စစ်ဆေသမဟု၏ စုစုပေါင်သအချိန်ကို အရဟိန်မဌဟင့်ရန်အတလက် စစ်ဆေသမဟုအတလက် လုံလောက်သောမဌင့်မာသသော ရာခိုင်နဟုန်သတစ်ခု လိုအပ်သည် (မက်ထရစ်မျာသကို ရာခိုင်နဟုန်သအနည်သငယ်ဖဌင့် အကဲဖဌတ်ရန်အတလက် ကိန်သဂဏန်သအချက်အလတ်သိသာထင်ရဟာသသောနမူနာကို စုဆောင်သခဌင်သသည် အချိန်အတော်ကဌာနိုင်သည်)၊ A/B slot အရေအတလက်သည် အလလန်အကန့်အသတ်ရဟိသည်။ သိသိသာသာ၊ ကျလန်ုပ်တို့သည် ထပ်လောင်သလေ့ကျင့်ရေသလုပ်ငန်သစဉ်အတလင်သ ကျလန်ုပ်တို့ရရဟိသည့် အလာသအလာအကောင်သဆုံသမော်ဒယ်မျာသကိုသာ စမ်သသပ်ရန် လိုအပ်ပါသည်။

ကပဌဿနာကိုဖဌေရဟင်သရန်အတလက် A/B စမ်သသပ်မဟု၏အောင်မဌင်မဟုကို ခန့်မဟန်သပေသသည့် သီသခဌာသအမျိုသအစာသခလဲခဌာသမဟုကို ကျလန်ုပ်တို့ လေ့ကျင့်သင်ကဌာသပေသခဲ့ပါသည်။ ထိုသို့လုပ်ဆောင်ရန်၊ ကျလန်ုပ်တို့သည် ဆုံသဖဌတ်ချက်ချသည့်စာရင်သဇယာသမျာသ၊ တိကျမဟု၊ ပဌန်လည်ခေါ်ဆိုမဟုနဟင့် လေ့ကျင့်မဟုသတ်မဟတ်မဟုတလင်၊ ရလဟေ့ဆိုင်သထာသသည့်အရာနဟင့် ထုတ်လလဟင့်မဟုမဟနမူနာကို အင်္ဂါရပ်မျာသအဖဌစ် ရယူပါသည်။ ကျလန်ုပ်တို့သည် မော်ဒယ်ကို လက်ရဟိထုတ်လုပ်နေသည့် မော်ဒယ်နဟင့်လည်သ နဟိုင်သယဟဉ်ကာ ဟန်ချက်ညီညီဖဌင့် နဟိုင်သယဟဉ်ကာ မော်ဒယ်၏ ရဟုပ်ထလေသမဟုကို ထည့်သလင်သစဉ်သစာသပါသည်။ ကအင်္ဂါရပ်မျာသအာသလုံသကို အသုံသပဌု၍ စမ်သသပ်မဟုမဟတ်တမ်သတလင် လေ့ကျင့်ထာသသော အမျိုသအစာသခလဲခလဲတစ်ခုသည် ကိုယ်စာသလဟယ်လောင်သပုံစံမျာသကို အကဲဖဌတ်သည်၊ ကျလန်ုပ်တို့၏အခဌေအနေတလင်၊ ၎င်သတို့သည် သစ်တောမျာသဖဌစ်ကဌောင်သနဟင့် A/B စာမေသပလဲတလင် မည်သည့်အရာကို အသုံသပဌုရမည်ကို ဆုံသဖဌတ်ပေသသည်။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

အကောင်အထည်ဖော်စဉ်တလင်၊ ကချဉ်သကပ်မဟုသည် ကျလန်ုပ်တို့အာသ အောင်မဌင်သော A/B စမ်သသပ်မဟုအရေအတလက်ကို အကဌိမ်မျာသစလာ တိုသမဌဟင့်နိုင်စေခဲ့သည်။

စမ်သသပ်ခဌင်သနဟင့် စောင့်ကဌည့်စစ်ဆေသခဌင်သ။

စမ်သသပ်ခဌင်သနဟင့် စောင့်ကဌည့်ခဌင်သတို့သည် ထူသဆန်သလောက်အောင်ပင် ကျလန်ုပ်တို့၏ကျန်သမာရေသကို မထိခိုက်စေပါ၊ ဆန့်ကျင်ဘက်အနေနဟင့် ၎င်သတို့သည် ၎င်သကို တိုသတက်စေပဌီသ ကျလန်ုပ်တို့အာသ မလိုအပ်သော စိတ်ဖိစီသမဟုမျာသကို သက်သာစေပါသည်။ စမ်သသပ်ခဌင်သသည် သင့်အာသ ချို့ယလင်သမဟုကို တာသဆီသနိုင်စေပဌီသ စောင့်ကဌည့်စစ်ဆေသခဌင်သသည် သုံသစလဲသူမျာသအပေါ် သက်ရောက်မဟုကို လျဟော့ချရန် အချိန်မီ သိရဟိနိုင်မည်ဖဌစ်သည်။

မကဌာမီ သို့မဟုတ် နောက်ပိုင်သတလင် သင့်စနစ်သည် အမဌဲတမ်သ အမဟာသအယလင်သမျာသ ရဟိလာမည်ကို ကနေရာတလင် နာသလည်ရန် အရေသကဌီသသည် - ၎င်သသည် မည်သည့်ဆော့ဖ်ဝဲလ်၏ ဖလံ့ဖဌိုသတိုသတက်မဟုစက်ဝန်သကဌောင့်ဖဌစ်သည်။ စနစ်ဖလံ့ဖဌိုသတိုသတက်မဟု၏အစတလင်အရာအာသလုံသပဌေလည်သလာသပဌီသဆန်သသစ်တီထလင်မဟု၏အဓိကအဆင့်မပဌီသမချင်သ bug အမျာသအပဌာသအမဌဲရဟိနေပါသည်။ သို့သော် အချိန်ကဌာလာသည်နဟင့်အမျဟ၊ အင်ထရိုပီသည် ၎င်သ၏အထလတ်အထိပ်သို့ ရောက်သလာသပဌီသ၊ အစပိုင်သတလင် ကျလန်တော်ပဌောခဲ့သည့် အစိတ်အပိုင်သမျာသ၏ ယိုယလင်သပျက်စီသမဟုနဟင့် ဒေတာပဌောင်သလဲမဟုမျာသကဌောင့် အမဟာသအယလင်သမျာသ ထပ်မံပေါ်လာပါသည်။

ကနေရာတလင် မည်သည့်စက်သင်ယူမဟုစနစ်မဆို ၎င်သ၏ဘဝစက်ဝန်သတစ်လျဟောက်လုံသ ၎င်သ၏အကျိုသအမဌတ်ကို ရဟုထောင့်မဟ ထည့်သလင်သစဉ်သစာသသင့်သည်ကို သတိပဌုစေလိုပါသည်။ အောက်ဖော်ပဌပါဂရပ်သည် ရဟာသပါသစပမ်သအမျိုသအစာသကိုဖမ်သရန် စနစ်လုပ်ဆောင်ပုံ ဥပမာ (ဂရပ်ရဟိမျဉ်သသည် သုညနဟင့်နီသသည်)။ တစ်နေ့တလင်၊ မဟာသယလင်သစလာ သိမ်သဆည်သထာသသော အရည်အချင်သတစ်ခုကဌောင့် သူမသည် ရူသသလပ်သလာသခဲ့သည်။ ကံတရာသကဌောင့်၊ ပုံမဟန်မဟုတ်သော အစပျိုသခဌင်သအတလက် စောင့်ကဌည့်ခဌင်သမရဟိဘဲ၊ ရလဒ်အနေဖဌင့်၊ စနစ်သည် ဆုံသဖဌတ်ချက်ချသောနယ်နိမိတ်ရဟိ "စပမ်သ" ဖိုင်တလဲတလင် စာလုံသအမဌောက်အမဌာသကို စတင်သိမ်သဆည်သခဲ့သည်။ အကျိုသဆက်မျာသကို ပဌုပဌင်နေသော်လည်သ၊ စနစ်သည် ငါသနဟစ်အတလင်သပင် သူ့ဘာသာသူ ပေသချေမည်မဟုတ်သည့်အတလက် အကဌိမ်မျာသစလာ အမဟာသမျာသပဌုလုပ်ထာသပဌီသဖဌစ်သည်။ ၎င်သသည် မော်ဒယ်၏ဘဝစက်ဝန်သ၏ရဟုထောင့်မဟ လုံသဝပျက်ကလက်မဟုဖဌစ်သည်။

Mail.ru Mail တလင် စက်သင်ယူမဟု လုပ်ဆောင်ခဌင်သ။

ထို့ကဌောင့်၊ စောင့်ကဌည့်ခဌင်သကဲ့သို့သော ရိုသရဟင်သသောအရာသည် မော်ဒယ်တစ်ညသ၏ဘဝတလင် အဓိကသော့ချက်ဖဌစ်လာနိုင်သည်။ စံနဟုန်သနဟင့် သိသာထင်ရဟာသသော မက်ထရစ်မျာသအပဌင်၊ ကျလန်ုပ်တို့သည် မော်ဒယ်တုံ့ပဌန်မဟုမျာသနဟင့် ရမဟတ်မျာသ ခလဲဝေမဟုအပဌင် သော့ချက်အင်္ဂါရပ်တန်ဖိုသမျာသ ဖဌန့်ဖဌူသမဟုကိုလည်သ ထည့်သလင်သစဉ်သစာသပါသည်။ KL ကလဲပဌာသမဟုကို အသုံသပဌုခဌင်သဖဌင့်၊ ကျလန်ုပ်တို့သည် လက်ရဟိဖဌန့်ဖဌူသမဟုကို သမိုင်သဝင်တစ်ခု သို့မဟုတ် A/B စမ်သသပ်မဟုရဟိ တန်ဖိုသမျာသနဟင့် မော်ဒယ်၏ကလဲလလဲချက်မျာသကို သတိပဌုမိစေပဌီသ ကျလန်ုပ်တို့အာသ အချိန်နဟင့်တစ်ပဌေသညီ ပဌောင်သလဲမဟုမျာသကို ပဌန်လည်ကဌည့်ရဟုနိုင်စေမည့် A/B စမ်သသပ်မဟုတလင် တန်ဖိုသမျာသကို နဟိုင်သယဟဉ်နိုင်ပါသည်။

အခဌေအနေအမျာသစုတလင်၊ ကျလန်ုပ်တို့သည် အနာဂတ်တလင် စောင့်ကဌည့်မဟုအဖဌစ် ကျလန်ုပ်တို့အသုံသပဌုသည့် ရိုသရဟင်သသော heuristics သို့မဟုတ် မော်ဒယ်မျာသကို အသုံသပဌုကာ ကျလန်ုပ်တို့၏ ပထမဆုံသဗာသရဟင်သမျာသကို စတင်လုပ်ဆောင်ပါသည်။ ဥပမာအာသဖဌင့်၊ ကျလန်ုပ်တို့သည် သီသခဌာသအလန်လိုင်သစတိုသမျာသအတလက် ပုံမဟန်ဆိုင်မျာသနဟင့် နဟိုင်သယဟဉ်ကာ NER မော်ဒယ်ကို စောင့်ကဌည့်ပဌီသ ၎င်သတို့နဟင့် နဟိုင်သယဟဉ်လျဟင် အမျိုသအစာသခလဲခဌာသမဟု အကျုံသဝင်မဟု ကျဆင်သသလာသပါက အကဌောင်သရင်သမျာသကို နာသလည်ပါသည်။ နောက်ထပ်အသုံသဝင်သော heuristics အသုံသပဌုမဟု။

ရလဒ်မျာသကို

ဆောင်သပါသရဲ့ အဓိကကျတဲ့ အတလေသအမဌင်တလေကို ပဌန်ကဌည့်ရအောင်။

  • Fibdeck. ကျလန်ုပ်တို့သည် အသုံသပဌုသူအကဌောင်သ အမဌဲစဉ်သစာသသည်- ကျလန်ုပ်တို့၏အမဟာသမျာသကို သူမည်သို့နေထိုင်မည်၊ ၎င်သတို့ကို မည်သို့သတင်သပို့နိုင်မည်နည်သ။ အသုံသပဌုသူမျာသသည် လေ့ကျင့်ရေသမော်ဒယ်မျာသအတလက် သန့်စင်သောတုံ့ပဌန်ချက်၏ရင်သမဌစ်မဟုတ်ကဌောင်သ မမေ့ပါနဟင့်၊ ၎င်သအာသ အရန် ML စနစ်မျာသ၏အကူအညီဖဌင့် ရဟင်သလင်သရန် လိုအပ်ပါသည်။ အသုံသပဌုသူထံမဟ အချက်ပဌမဟုကို စုဆောင်သရန် မဖဌစ်နိုင်ပါက၊ ဥပမာ၊ ချိတ်ဆက်ထာသသော စနစ်မျာသ တုံ့ပဌန်ချက်၏ အခဌာသအရင်သအမဌစ်မျာသကို ကျလန်ုပ်တို့ ရဟာဖလေပါသည်။
  • အပိုသင်တန်သ. ကနေရာတလင် အဓိကအချက်မဟာ အဆက်ပဌတ်နေသောကဌောင့် ကျလန်ုပ်တို့သည် လက်ရဟိထုတ်လုပ်မဟုပုံစံကို အာသကိုသပါသည်။ ဟန်ချက်ညီညီ ပုံမဟန်ပဌုလုပ်ခဌင်သနဟင့် အလာသတူလဟည့်ကလက်မျာသကဌောင့် ၎င်သတို့သည် ယခင်ပုံစံမျာသနဟင့် မျာသစလာကလာခဌာသမဟုမရဟိစေရန် မော်ဒယ်အသစ်မျာသကို လေ့ကျင့်ပေသပါသည်။
  • ချထာသပေသပါ။. မက်ထရစ်မျာသကို အခဌေခံ၍ အလိုအလျောက် ဖဌန့်ကျက်ခဌင်သသည် မော်ဒယ်မျာသကို အကောင်အထည်ဖော်ရန် အချိန်ကို မျာသစလာ လျဟော့ချပေသပါသည်။ ကိန်သဂဏန်သစာရင်သဇယာသမျာသကို စောင့်ကဌည့်ခဌင်သနဟင့် ဆုံသဖဌတ်ချက်ချခဌင်သဆိုင်ရာ ဖဌန့်ဝေမဟုမျာသ၊ သင်၏ အနာသယူအိပ်စက်ခဌင်သနဟင့် အကျိုသဖဌစ်ထလန်သစေသော စနေ၊

ကောင်သပဌီ၊ ဒါက မင်သရဲ့ ML စနစ်တလေကို ပိုမဌန်အောင် မဌဟင့်တင်ဖို့၊ စျေသကလက်ကို ပိုမဌန်လာအောင်၊ သူတို့ကို ပိုယုံကဌည်စိတ်ချရပဌီသ စိတ်ဖိစီသမဟုနည်သအောင် ကူညီပေသမယ်လို့ ငါမျဟော်လင့်ပါတယ်။

source: www.habr.com

မဟတ်ချက် Add