မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

ကျွန်ုပ်တို့၏ အနာဂတ် ကွန်ပျူတာအမြင်စနစ်အတွက် နည်းပညာများနှင့် မော်ဒယ်များကို ကျွန်ုပ်တို့ ကုမ္ပဏီ၏ မတူညီသော ပရောဂျက်များတွင် ဖန်တီးကာ ဖြည်းဖြည်းချင်း တိုးတက်အောင် ပြုလုပ်ခဲ့သည် - Mail၊ Cloud၊ Search။ ၎င်းတို့သည် ကောင်းမွန်သော ဒိန်ခဲ သို့မဟုတ် ကော့ညက်ကဲ့သို့ ရင့်ကျက်သည်။ ကျွန်ုပ်တို့၏အာရုံကြောကွန်ရက်များသည် အသိအမှတ်ပြုမှုတွင် ကောင်းမွန်သောရလဒ်များကိုပြသကြောင်း တစ်နေ့တွင် ကျွန်ုပ်တို့သဘောပေါက်ခဲ့ပြီး ၎င်းတို့ကို တစ်ခုတည်းသော b2b ထုတ်ကုန်တစ်ခုဖြစ်သည့် Vision - ယခုကျွန်ုပ်တို့ကိုယ်တိုင်အသုံးပြုပြီး သင့်အားအသုံးပြုရန်ကမ်းလှမ်းမှုတစ်ခုအဖြစ် ပေါင်းစပ်ရန် ဆုံးဖြတ်ခဲ့သည်။

ယနေ့တွင်၊ Mail.Ru Cloud Solutions ပလပ်ဖောင်းရှိ ကျွန်ုပ်တို့၏ကွန်ပြူတာအမြင်နည်းပညာသည် အောင်မြင်စွာလုပ်ဆောင်နေပြီး အလွန်ရှုပ်ထွေးသောလက်တွေ့ပြဿနာများကို ဖြေရှင်းနိုင်ပါပြီ။ ၎င်းသည် ကျွန်ုပ်တို့၏ဒေတာအတွဲများကို လေ့ကျင့်သင်ကြားပြီး အသုံးချပြဿနာများကိုဖြေရှင်းရာတွင် အထူးပြုထားသည့် အာရုံကြောကွန်ရက်များစွာကို အခြေခံထားသည်။ ဝန်ဆောင်မှုအားလုံးသည် ကျွန်ုပ်တို့၏ ဆာဗာ အဆောက်အဦများပေါ်တွင် လုပ်ဆောင်ပါသည်။ အများသူငှာ Vision API ကို သင့်အပလီကေးရှင်းများတွင် ပေါင်းစပ်နိုင်ပြီး ဝန်ဆောင်မှု၏ စွမ်းဆောင်နိုင်ရည်အားလုံးကို ရရှိနိုင်ပါသည်။ API သည် မြန်ဆန်သည် - ဆာဗာ GPU များကြောင့်၊ ကျွန်ုပ်တို့၏ကွန်ရက်အတွင်း ပျမ်းမျှတုံ့ပြန်ချိန်သည် 100 ms ဖြစ်သည်။

ကြောင်ကိုသွားပါ၊ အသေးစိတ်ဇာတ်လမ်းတစ်ခုနှင့် Vision ၏အလုပ်နမူနာများစွာရှိသည်။

ဖော်ပြထားသော မျက်နှာမှတ်သားမှုနည်းပညာများကို ကျွန်ုပ်တို့ကိုယ်တိုင်အသုံးပြုသည့် ဝန်ဆောင်မှုတစ်ခု၏ ဥပမာတစ်ခုဖြစ်သည်။ ဖြစ်ရပ်များ. ၎င်း၏ အစိတ်အပိုင်းများထဲမှ တစ်ခုသည် ညီလာခံအမျိုးမျိုးတွင် ကျွန်ုပ်တို့ ထည့်သွင်းသည့် Vision ဓာတ်ပုံရပ်များဖြစ်သည်။ အကယ်၍ သင်သည် ထိုကဲ့သို့သော ဓာတ်ပုံမှတ်တိုင်သို့ ချဉ်းကပ်ပါ၊ တပ်ဆင်ထားသော ကင်မရာဖြင့် ဓာတ်ပုံရိုက်ပြီး သင့်အီးမေးလ်ကို ရိုက်ထည့်ပါက သင်သည် အစည်းအဝေးပွဲ၏ ဝန်ထမ်းဓာတ်ပုံဆရာများက ရိုက်ကူးထားသည့် ဓာတ်ပုံများထဲမှ ဓာတ်ပုံများကို စနစ်က ချက်ချင်းရှာဖွေပေးမည်ဖြစ်ပြီး ဆန္ဒရှိပါက၊ တွေ့ရှိသော ဓာတ်ပုံများကို အီးမေးလ်ဖြင့် ပေးပို့ပါမည်။ ထို့အပြင် ကျွန်ုပ်တို့သည် အစီအစဥ်ပုံတူရိုက်ချက်များအကြောင်း ပြောနေခြင်းမဟုတ်ပါ—လာရောက်ကြည့်ရှုသူလူအုပ်ကြီး၏နောက်ခံတွင်ပင် သင့်အား အမြင်အာရုံက အသိအမှတ်ပြုပါသည်။ ဟုတ်ပါတယ်၊ အဲဒါတွေက သူတို့ကိုယ်သူတို့ အသိအမှတ်ပြုထားတဲ့ ဓာတ်ပုံမဟုတ်ဘူး၊ ဒါတွေက ဧည့်သည်တွေရဲ့ တပ်ဆင်ထားတဲ့ ကင်မရာတွေနဲ့ ရိုးရှင်းစွာ ဓာတ်ပုံရိုက်ပြီး အသိအမှတ်ပြုမှုမှော်ဆန်တဲ့ ဆာဗာတွေဆီ သတင်းအချက်အလက်တွေ ပို့ပေးတဲ့ လှပတဲ့ရပ်တည်မှုရှိတဲ့ တက်ဘလက်တွေချည်းပါပဲ။ ပြီးတော့ နည်းပညာရဲ့ ထိရောက်မှုကို ရုပ်ပုံအသိအမှတ်ပြုရေး ကျွမ်းကျင်သူတွေကြားမှာတောင် အံ့သြစရာကောင်းလောက်အောင်ကို တစ်ကြိမ်ထက်ပိုပြီး မြင်တွေ့ခဲ့ရပါတယ်။ အောက်တွင်ကျွန်ုပ်တို့သည်ဥပမာအချို့ကိုပြောပြပါမည်။

ဗွီဒီယိုဖွင့်ပါ

1. ကျွန်ုပ်တို့၏ Face Recognition Model

၁.၁။ Neural network နှင့် processing speed

အသိအမှတ်ပြုရန်အတွက်၊ ကျွန်ုပ်တို့သည် ResNet 101 neural network model ကို ပြုပြင်မွမ်းမံခြင်းကို အသုံးပြုပါသည်။ အဆုံးတွင် ပျမ်းမျှ Pooling ကို ArcFace တွင် လုပ်ဆောင်ပုံနှင့် ဆင်တူသော အပြည့်အဝချိတ်ဆက်ထားသော အလွှာတစ်ခုဖြင့် အစားထိုးပါသည်။ သို့သော်၊ ပုံဖော်ပြချက်များ၏အရွယ်အစားမှာ 128 ဖြစ်ပြီး 512 မဟုတ်ပါ။ ကျွန်ုပ်တို့၏လေ့ကျင့်ရေးအစုံတွင် လူ 10 ၏ ဓာတ်ပုံ 273 သန်းခန့်ပါရှိသည်။

ဂရုတစိုက်ရွေးချယ်ထားသော server configuration architecture နှင့် GPU computing ကြောင့် မော်ဒယ်သည် အလွန်လျင်မြန်စွာ အလုပ်လုပ်ပါသည်။ ကျွန်ုပ်တို့၏အတွင်းပိုင်းကွန်ရက်များရှိ API မှတုံ့ပြန်မှုကိုလက်ခံရရှိရန် 100 ms မှကြာသည် - ၎င်းတွင်မျက်နှာကိုသိရှိခြင်း (ဓာတ်ပုံတစ်ပုံတွင်မျက်နှာတစ်ခုကိုရှာဖွေခြင်း)၊ API တုံ့ပြန်မှုတွင် PersonID ကိုအသိအမှတ်ပြုခြင်းနှင့်ပြန်လာခြင်းပါဝင်သည်။ အဝင်ဒေတာ အများအပြား - ဓာတ်ပုံများနှင့် ဗီဒီယိုများဖြင့် - ဝန်ဆောင်မှုသို့ ဒေတာလွှဲပြောင်းရန်နှင့် တုံ့ပြန်မှုရရှိရန် အချိန်များစွာကြာမည်ဖြစ်သည်။

၁.၂။ မော်ဒယ်၏ထိရောက်မှုကိုအကဲဖြတ်ခြင်း။

သို့သော် အာရုံကြောကွန်ရက်များ၏ စွမ်းဆောင်ရည်ကို ဆုံးဖြတ်ခြင်းသည် အလွန်ရှင်းလင်းသော အလုပ်ဖြစ်သည်။ ၎င်းတို့၏ အလုပ်အရည်အသွေးသည် မော်ဒယ်များကို လေ့ကျင့်သင်ကြားထားသည့် ဒေတာအစုံအလင်ပေါ်တွင် မူတည်ပြီး ၎င်းတို့ကို သီးခြားဒေတာဖြင့် လုပ်ဆောင်ရန်အတွက် အကောင်းဆုံးဖြစ်မဖြစ်ပေါ်တွင် မူတည်ပါသည်။

ကျွန်ုပ်တို့သည် လူကြိုက်များသော LFW အတည်ပြုစစ်ဆေးမှုဖြင့် ကျွန်ုပ်တို့၏မော်ဒယ်၏တိကျမှုကို စတင်အကဲဖြတ်ခဲ့သော်လည်း ၎င်းသည် အလွန်သေးငယ်ပြီး ရိုးရှင်းပါသည်။ 99,8% တိကျမှုရောက်ပြီးနောက်၊ ၎င်းသည် အသုံးမဝင်တော့ပါ။ အသိအမှတ်ပြုမော်ဒယ်များကို အကဲဖြတ်ရန် ပြိုင်ဆိုင်မှုကောင်းတစ်ခု ရှိသည် - Megaface သည် ကျွန်ုပ်တို့ တဖြည်းဖြည်း 82% အဆင့် 1 သို့ရောက်ရှိခဲ့သည်။ Megaface စမ်းသပ်မှုတွင် ဓာတ်ပုံပေါင်း တစ်သန်းကျော် ပါဝင်သည် - အာရုံထွေပြားခြင်း - မော်ဒယ်သည် Facescrub မှ ထင်ရှားကျော်ကြားသူများ၏ ဓာတ်ပုံထောင်ပေါင်းများစွာကို ကောင်းစွာ ခွဲခြားနိုင်သင့်သည်။ distractors မှဒေတာအတွဲ။ သို့သော်လည်း Megaface စမ်းသပ်မှုတွင် အမှားအယွင်းများကို ရှင်းလင်းပြီးနောက်၊ ရှင်းလင်းထားသောဗားရှင်းဖြင့် ကျွန်ုပ်တို့သည် 98% အဆင့် 1 ၏ တိကျမှုကို ရရှိသည် (ထင်ရှားကျော်ကြားသူများ၏ ဓာတ်ပုံများသည် ယေဘုယျအားဖြင့် အလွန်တိကျသည်) ကို တွေ့ရှိခဲ့သည်။ ထို့ကြောင့်၊ ၎င်းတို့သည် Megaface နှင့်ဆင်တူသော်လည်း သာမန်လူများ၏ ဓာတ်ပုံများဖြင့် သီးခြား မှတ်ပုံတင်ခြင်း စမ်းသပ်မှုကို ဖန်တီးခဲ့သည်။ ထို့နောက် ကျွန်ုပ်တို့သည် ကျွန်ုပ်တို့၏ဒေတာအတွဲများပေါ်တွင် အသိအမှတ်ပြုမှု တိကျမှုကို မြှင့်တင်ပြီး ရှေ့ကို ဆက်သွားခဲ့သည်။ ထို့အပြင်၊ ကျွန်ုပ်တို့သည် ဓာတ်ပုံထောင်ပေါင်းများစွာပါဝင်သော အစုလိုက်အပြုံလိုက် အရည်အသွေးစမ်းသပ်မှုကို အသုံးပြုပါသည်။ ၎င်းသည် သုံးစွဲသူ၏ cloud တွင် မျက်နှာတဂ်ခြင်းကို အတုယူသည်။ ဤကိစ္စတွင်၊ အစုအဖွဲ့များသည် အသိအမှတ်ပြုနိုင်သော လူတစ်ဦးစီအတွက် တစ်အုပ်စုဖြစ်သည်။ ကျွန်ုပ်တို့သည် စစ်မှန်သောအုပ်စုများပေါ်တွင် အလုပ်၏အရည်အသွေးကို စစ်ဆေးခဲ့သည်။

ဟုတ်ပါတယ်, အသိအမှတ်ပြုမှုအမှားအယွင်းများမည်သည့်မော်ဒယ်နှင့်အတူဖြစ်ပေါ်တတ်၏။ သို့သော် ထိုသို့သောအခြေအနေများကို သီးခြားအခြေအနေများအတွက် ကန့်သတ်ချက်များကို ကောင်းစွာချိန်ညှိခြင်းဖြင့် ဖြေရှင်းလေ့ရှိသည် (ကွန်ဖရင့်အားလုံးအတွက် ကျွန်ုပ်တို့သည် တူညီသောအတိုင်းအတာများကို အသုံးပြုသော်လည်း၊ ဥပမာအားဖြင့်၊ ဝင်ရောက်ထိန်းချုပ်မှုစနစ်များအတွက် ကျွန်ုပ်တို့သည် မှားယွင်းသောအပြုသဘောများနည်းပါးစေရန်အတွက် ကန့်သတ်ချက်များကို အလွန်တိုးမြှင့်ရပါမည်)။ ညီလာခံလာရောက်သူ အများစုကို ကျွန်ုပ်တို့၏ Vision ဓာတ်ပုံပြခန်းများမှ မှန်ကန်စွာ အသိအမှတ်ပြုခဲ့သည်။ တစ်ခါတစ်ရံတွင် တစ်စုံတစ်ဦးသည် ဖြတ်တောက်ထားသော အစမ်းကြည့်ရှုမှုကို ကြည့်ရှုပြီး "မင်းရဲ့စနစ်က အမှားလုပ်ထားတယ်၊ အဲဒါ ငါမဟုတ်ဘူး" လို့ ပြောတတ်တယ်။ ထို့နောက် ဓာတ်ပုံတစ်ခုလုံးကို ကျွန်ုပ်တို့ဖွင့်ကြည့်လိုက်ရာ ဓာတ်ပုံထဲတွင် ဤဧည့်သည် အမှန်တကယ်ရှိနေကြောင်း၊ ကျွန်ုပ်တို့သာ သူ့ကို ဓာတ်ပုံရိုက်နေခြင်းမဟုတ်၊ အခြားတစ်ယောက်ယောက်သာ၊ ထိုလူသည် မှုန်ဝါးသောဇုန်တွင် နောက်ခံတွင် ရှိနေခြင်းဖြစ်သည်။ ထို့အပြင်၊ မျက်နှာ၏တစ်စိတ်တစ်ပိုင်းကို မမြင်ရသော်လည်း၊ လူသည် ပရိုဖိုင်တွင် ရပ်နေချိန် သို့မဟုတ် တစ်ဝက်တစ်ပျက်ပင် လှည့်ကြည့်သည့်အခါတွင်ပင် အာရုံကြောကွန်ရက်က မှန်ကန်စွာ မှတ်မိတတ်သည်။ မြင်ကွင်းကျယ်မှန်ဘီလူးဖြင့် ရိုက်ကူးသောအခါတွင် မျက်နှာသည် အလင်းပုံပျက်နေသည့် နေရာတွင်ပင် လူတစ်ဦးကို မှတ်မိနိုင်သော စနစ်ဖြစ်သည်။

၁.၃။ ခက်ခဲသော အခြေအနေများတွင် စမ်းသပ်ခြင်း ဥပမာများ

အောက်တွင် ကျွန်ုပ်တို့၏ neural network အလုပ်လုပ်ပုံ ဥပမာများဖြစ်သည်။ PersonID - လူတစ်ဦး၏ထူးခြားသောအမှတ်အသားဖြစ်သော PersonID ကို အသုံးပြု၍ အညွှန်းတပ်ရမည့် ထည့်သွင်းမှုတွင် ဓာတ်ပုံများကို တင်သွင်းပါသည်။ ပုံနှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသောပုံများသည် ID တူညီပါက၊ မော်ဒယ်များအလိုက်၊ ဤဓာတ်ပုံများသည် တူညီသောလူကို ပုံဖော်ထားသည်။

စမ်းသပ်သောအခါတွင်၊ ကျွန်ုပ်တို့သည် သီးခြားရလဒ်တစ်ခုရရှိရန် configure လုပ်နိုင်သည့် ဘောင်များနှင့် စံပြသတ်မှတ်ချက်များထံသို့ ဝင်ရောက်ခွင့်ရှိသည်ကို ချက်ချင်းသတိပြုကြပါစို့။ အများသူငှာ API ကို အများသုံးကိစ္စများတွင် အများဆုံးတိကျမှုအတွက် အကောင်းဆုံးပြုလုပ်ထားသည်။

အရိုးရှင်းဆုံးအရာ၊ ရှေ့မျက်နှာစာကို မှတ်သားခြင်းဖြင့် စတင်ကြပါစို့။

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

ကောင်းပြီ၊ အဲဒါက လွယ်လွန်းတယ်။ အလုပ်ရှုပ်ရအောင် မုတ်ဆိတ်မွေးနဲ့ နှစ်လက်တစ်ဆုပ်စာ ပေါင်းထည့်လိုက်ပါ။

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

အချို့က ၎င်းသည် ခက်ခဲလွန်းသည်ဟု ဆိုကြလိမ့်မည်၊ အကြောင်းမှာ နှစ်ခုစလုံးတွင် မျက်နှာတစ်ခုလုံးကို မြင်နိုင်ပြီး မျက်နှာနှင့်ပတ်သက်သော အချက်အလက်များစွာကို algorithm တွင်ရရှိနိုင်သောကြောင့်ဖြစ်သည်။ ကောင်းပြီ၊ Tom Hardy ကို ပရိုဖိုင်အဖြစ် ပြောင်းကြည့်ရအောင်။ ဤပြဿနာသည် ပိုမိုရှုပ်ထွေးပြီး နိမ့်ပါးသော အမှားအယွင်းနှုန်းကို ထိန်းသိမ်းထားစဉ်တွင် ၎င်းကို အောင်မြင်စွာဖြေရှင်းနိုင်စေရန် ကြိုးပမ်းအားထုတ်မှုများစွာကို သုံးစွဲခဲ့သည်- ကျွန်ုပ်တို့သည် လေ့ကျင့်ရေးအစုံကို ရွေးချယ်ကာ၊ အာရုံကြောကွန်ရက်၏ တည်ဆောက်မှုပုံစံဖြင့် တွေးခေါ်ကာ ဆုံးရှုံးမှုများကို ဂုဏ်ပြုကာ အကြိုလုပ်ဆောင်မှုကို မြှင့်တင်ခဲ့သည်။ ဓာတ်ပုံများ။

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

သူ့အပေါ် ခေါင်းစွပ်တစ်ခု ထားရအောင်။

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

စကားမစပ်၊ ဤသည်မှာ အထူးခက်ခဲသော အခြေအနေတစ်ခု၏ ဥပမာတစ်ခုဖြစ်သည်၊ အကြောင်းမှာ မျက်နှာသည် ကြီးမားစွာ ဖုံးကွယ်နေပြီး အောက်ခြေဓာတ်ပုံတွင် မျက်လုံးကို ဖုံးကွယ်ထားသည့် အရိပ်နက်တစ်ခုလည်း ရှိနေသောကြောင့် ဖြစ်သည်။ လက်တွေ့ဘဝတွင်၊ လူများသည် မျက်မှန်တပ်ခြင်းဖြင့် ၎င်းတို့၏အသွင်အပြင်ကို ပြောင်းလဲလေ့ရှိကြသည်။ Tom နဲ့အတူတူလုပ်ရအောင်။

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

အိုကေ၊ ခေတ်အမျိုးမျိုးက ဓာတ်ပုံတွေကို စမ်းကြည့်ရအောင်၊ ဒီတစ်ခါတော့ မတူညီတဲ့ သရုပ်ဆောင်တစ်ယောက်နဲ့ စမ်းသပ်ကြည့်မယ်။ အထူးသဖြင့် အသက်အရွယ်နှင့်ဆိုင်သော အပြောင်းအလဲများကို သိသာထင်ရှားသည့် ပိုမိုရှုပ်ထွေးသော ဥပမာတစ်ခုကို ကြည့်ကြပါစို့။ အခြေအနေက သိပ်မဝေးပါဘူး၊ ပတ်စပို့ထဲက ဓာတ်ပုံကို ကိုင်ဆောင်သူရဲ့ မျက်နှာနဲ့ နှိုင်းယှဉ်ဖို့ လိုတဲ့အခါမျိုးမှာ မကြာခဏ ဖြစ်တတ်ပါတယ်။ နောက်ဆုံးတွင်၊ ပိုင်ရှင်သည် အသက် 20 အရွယ်တွင် နိုင်ငံကူးလက်မှတ်တွင် ပထမဆုံးဓာတ်ပုံကို ပေါင်းထည့်လိုက်ပြီး အသက် 45 နှစ်တွင် လူတစ်ယောက်သည် အလွန်ပြောင်းလဲသွားနိုင်သည်-

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

မဖြစ်နိုင်သောမစ်ရှင်များတွင် အဓိကပါရဂူသည် အသက်အရွယ်အရ များစွာမပြောင်းလဲသေးဟု ထင်ပါသလား။ အပေါ်နဲ့ အောက်ပုံတွေကို လူအနည်းငယ်လောက်တောင် ပေါင်းစပ်ထားမယ်လို့ ထင်ပါတယ်၊

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

အာရုံကြောကွန်ရက်များသည် ပုံပန်းသဏ္ဍာန်ပြောင်းလဲမှုများကို ပိုမိုကြုံတွေ့ရလေ့ရှိသည်။ ဥပမာအားဖြင့်၊ တစ်ခါတစ်ရံတွင် အမျိုးသမီးများသည် အလှကုန်များ၏အကူအညီဖြင့် ၎င်းတို့၏ပုံသဏ္ဍာန်ကို ပြောင်းလဲနိုင်သည်-

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

ယခု အလုပ်အား ပို၍ပင် ရှုပ်ထွေးစေသည်- မျက်နှာ၏ မတူညီသော အစိတ်အပိုင်းများကို မတူညီသော ဓာတ်ပုံများဖြင့် ဖုံးအုပ်ထားသည် ဆိုပါစို့။ ထိုသို့သောအခြေအနေမျိုးတွင်၊ algorithm သည် နမူနာတစ်ခုလုံးကို နှိုင်းယှဉ်၍မရပါ။ သို့သော် Vision သည် ဤကဲ့သို့သော အခြေအနေများကို ကောင်းမွန်စွာ ကိုင်တွယ်သည်။

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

စကားမစပ်၊ ဓာတ်ပုံတစ်ပုံတွင် မျက်နှာများစွာရှိနိုင်သည်၊ ဥပမာအားဖြင့်၊ လူပေါင်း ၁၀၀ ကျော်သည် ခန်းမတစ်ခု၏ ယေဘူယျဓာတ်ပုံတစ်ပုံကို အံဝင်ခွင်ကျဖြစ်စေနိုင်သည်။ မျက်နှာများစွာကို အာရုံမစိုက်နိုင်သောကြောင့် အာရုံကြောကွန်ရက်များအတွက် ခက်ခဲသောအခြေအနေတစ်ခုဖြစ်သည်။ သို့သော်၊ ဓာတ်ပုံကို လုံလောက်သော ကြည်လင်ပြတ်သားမှုနှင့် အရည်အသွေးဖြင့် ရိုက်ကူးပါက (မျက်နှာကို တစ်စတုရန်းလျှင် အနည်းဆုံး 100 pixels) ဖြင့် ရိုက်ကူးပါက Vision သည် ၎င်းကို သိရှိနိုင်မည်ဖြစ်သည်။

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

စောင့်ကြည့်ကင်မရာများမှ အစီရင်ခံသည့် ဓာတ်ပုံများနှင့် ပုံရိပ်များ၏ ထူးခြားချက်မှာ လူများသည် အာရုံစူးစိုက်မှု မရှိခြင်း သို့မဟုတ် ထိုအချိန်တွင် လှုပ်ရှားနေခြင်းကြောင့် မကြာခဏ မှုန်ဝါးသွားခြင်းဖြစ်သည်-

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

ထို့အပြင်၊ အလင်းရောင်ပြင်းအားသည် ပုံတစ်ပုံမှတစ်ပုံအထိ ကွဲပြားနိုင်သည်။ ၎င်းသည်လည်း မကြာခဏ ထိမိ၍လဲစရာဖြစ်လာသည် ၊ အယ်လဂိုရီသမ်များစွာသည် ၎င်းတို့နှင့် အတိအကျကိုက်ညီသည်ဟု မပြောဘဲ မှောင်လွန်းပြီး အလင်းလွန်လွန်းသော ပုံများကို မှန်ကန်စွာလုပ်ဆောင်ရာတွင် ခက်ခဲလွန်းပါသည်။ ဤရလဒ်ရရှိရန် သင်သည် သတ်မှတ်ထားသောနည်းလမ်းဖြင့် သတ်မှတ်သတ်မှတ်ရန် လိုအပ်သည်၊ ဤအင်္ဂါရပ်ကို လူသိရှင်ကြား မရရှိနိုင်သေးကြောင်း သတိပေးပါရစေ။ ကျွန်ုပ်တို့သည် သုံးစွဲသူအားလုံးအတွက် တူညီသော အာရုံကြောကွန်ရက်ကို အသုံးပြုသည်၊ ၎င်းတွင် လက်တွေ့လုပ်ငန်းဆောင်တာအများစုအတွက် သင့်လျော်သော သတ်မှတ်ချက်များရှိသည်။

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

မကြာသေးမီက ကျွန်ုပ်တို့သည် အာရှမျက်နှာများကို တိကျမှန်ကန်မှုဖြင့် မှတ်သားနိုင်သော မော်ဒယ်ဗားရှင်းအသစ်ကို မကြာသေးမီက ထုတ်လွှင့်ခဲ့သည်။ ဤသည်မှာ “စက်သင်ကြားမှု” (သို့မဟုတ် “အာရုံကြောကွန်ရက်”) လူမျိုးရေးခွဲခြားမှုဟုပင် ခေါ်ဝေါ်ခဲ့သည့် ပြဿနာကြီးတစ်ခုဖြစ်သည်။ ဥရောပနှင့် အမေရိကန် အာရုံကြောကွန်ရက်များက ကုလားဖြူမျက်နှာများကို ကောင်းမွန်စွာ အသိအမှတ်ပြုထားသော်လည်း Mongoloid နှင့် Negroid တို့နှင့် ရင်ဆိုင်ရသည့် အခြေအနေမှာ များစွာဆိုးရွားသည်။ တရုတ်နိုင်ငံမှာ အခြေအနေက လုံးဝဆန့်ကျင်ဘက်ဖြစ်မယ်ထင်တယ်။ နိုင်ငံတစ်ခု၏ လွှမ်းမိုးကြီးစိုးသော လူအမျိုးအစားများကို ထင်ဟပ်စေသည့် လေ့ကျင့်ရေးဒေတာအစုံများအကြောင်းဖြစ်သည်။ ဒါပေမယ့် အခြေအနေတွေက ပြောင်းလဲနေတယ်၊ ​​ဒီနေ့တော့ ဒီပြဿနာက သိပ်ပြီးမပြင်းထန်ပါဘူး။ Vision သည် မတူညီသော လူမျိုးစုများအတွက် ပြဿနာမရှိပါ။

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

Facial recognition သည် ကျွန်ုပ်တို့၏နည်းပညာ၏ အသုံးချမှုများစွာထဲမှ တစ်ခုသာဖြစ်ပြီး မည်သည့်အရာကိုမဆို မှတ်မိရန် Vision ကို လေ့ကျင့်ပေးနိုင်ပါသည်။ ဥပမာအားဖြင့်၊ အယ်လဂိုရီသမ်များအတွက် ခက်ခဲသောအခြေအနေများတွင် အပါအဝင်၊ လိုင်စင်နံပါတ်များ- ပြတ်သားသောထောင့်များ၊ ညစ်ပတ်ပြီး လိုင်စင်ပြားများကို ဖတ်ရခက်ခဲသည်။

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

2. လက်တွေ့အသုံးပြုမှုကိစ္စများ

၂.၁။ Physical access control- လူနှစ်ဦး တူညီသော pass ကို အသုံးပြုသောအခါ

Vision ၏အကူအညီဖြင့် သင်သည် ဝန်ထမ်းများရောက်ရှိမှုနှင့် ထွက်ခွာမှုကို မှတ်တမ်းတင်သည့်စနစ်များကို သင်အကောင်အထည်ဖော်နိုင်သည်။ အီလက်ထရွန်းနစ် ဖြတ်သန်းခွင့်များကို အခြေခံသည့် ရိုးရာစနစ်တွင် သိသာထင်ရှားသော အားနည်းချက်များ ရှိသည်၊ ဥပမာ၊ တံဆိပ်တစ်ခုသုံး၍ လူနှစ်ဦးကို သင်ဖြတ်သန်းနိုင်သည်။ ဝင်ရောက်ထိန်းချုပ်မှုစနစ် (ACS) ကို Vision ဖြင့် ဖြည့်စွက်ထားပါက၊ မည်သူက လာ/ထွက်သည်နှင့် မည်သည့်အချိန်တို့ကို ရိုးသားစွာ မှတ်တမ်းတင်ပါမည်။

၂.၂။ အချိန်ခြေရာခံ

ဤ Vision အသုံးပြုမှုကိစ္စသည် ယခင်တစ်ခုနှင့် နီးကပ်စွာ ဆက်စပ်နေသည်။ ကျွန်ုပ်တို့၏ မျက်နှာမှတ်မိခြင်းဝန်ဆောင်မှုဖြင့် ဝင်ရောက်အသုံးပြုမှုစနစ်အား ဖြည့်စွက်ပါက၊ ၎င်းသည် ဝင်ရောက်ထိန်းချုပ်မှုချိုးဖောက်မှုများကို စစ်ဆေးရုံသာမက အဆောက်အအုံ သို့မဟုတ် အဆောက်အအုံအတွင်း ဝန်ထမ်းများ၏ အမှန်တကယ်ရောက်ရှိနေမှုကို မှတ်ပုံတင်ရန်လည်း လုပ်ဆောင်နိုင်မည်ဖြစ်သည်။ တစ်နည်းဆိုရသော် Vision သည် သင့်အား အလုပ်လာလုပ်သူနှင့် ဘယ်အချိန်က ထွက်ခွာသွားကြောင်း၊ ၎င်း၏လုပ်ဖော်ကိုင်ဖက်များက သူ့အထက်လူကြီးများရှေ့တွင် ဖုံးကွယ်ထားသော်လည်း မည်သူက အလုပ်ပျက်သွားသည်ကို ရိုးသားစွာ ထည့်သွင်းတွက်ချက်ရန် ကူညီပေးမည်ဖြစ်သည်။

၂.၃။ ဗီဒီယိုပိုင်းခြားစိတ်ဖြာချက်- လူများခြေရာခံခြင်းနှင့် လုံခြုံရေး

Vision ကိုအသုံးပြု၍ လူများကိုခြေရာခံခြင်းဖြင့်၊ သင်သည် ဈေးဝယ်နေရာများ၊ ရထားဘူတာများ၊ လမ်းများ၊ လမ်းများနှင့် အခြားအများပြည်သူဆိုင်ရာနေရာများ၏ အစစ်အမှန်အသွားအလာကို တိကျစွာအကဲဖြတ်နိုင်ပါသည်။ ကျွန်ုပ်တို့၏ခြေရာခံခြင်းသည် ဥပမာအားဖြင့် ဂိုဒေါင်တစ်ခု သို့မဟုတ် အခြားအရေးကြီးသောရုံးပရဝုဏ်များသို့ ဝင်ရောက်ခြင်းအား ထိန်းချုပ်ရာတွင်လည်း ကြီးမားသောအကူအညီဖြစ်နိုင်သည်။ လူများနှင့် မျက်နှာများကို ခြေရာခံခြင်းက လုံခြုံရေးပြဿနာများကို ဖြေရှင်းပေးပါသည်။ သင့်စတိုးဆိုင်မှခိုးယူသူတစ်ဦးကိုဖမ်းမိပါသလား။ Vision မှ ပြန်ပေးထားသည့် သူ၏ PersonID ကို သင်၏ ဗီဒီယို ပိုင်းခြားစိတ်ဖြာမှု ဆော့ဖ်ဝဲလ်၏ အမည်ပျက်စာရင်းတွင် ထည့်သွင်းပြီး နောက်တစ်ကြိမ် ဤအမျိုးအစား ထပ်ပေါ်လာပါက လုံခြုံရေးကို စနစ်က ချက်ချင်း သတိပေးပါမည်။

၂.၄။ ကုန်သွယ်မှုတွင်

လက်လီနှင့် ဝန်ဆောင်မှုလုပ်ငန်း အသီးသီးသည် တန်းစီစောင့်ဆိုင်းခြင်းကို စိတ်ဝင်စားကြသည်။ Vision ၏အကူအညီဖြင့်၊ ၎င်းသည် ကျပန်းလူစုလူဝေးမဟုတ်သော်လည်း လူတန်းတစ်ခုဖြစ်ကြောင်း အသိအမှတ်ပြုနိုင်ပြီး ၎င်း၏အရှည်ကို ဆုံးဖြတ်နိုင်သည်။ ထို့နောက် စနစ်သည် တန်းစီခြင်းဆိုင်ရာ တာဝန်ခံများအား အခြေအနေကို သိရှိနိုင်စေရန် အကြောင်းကြားပေးသည်- ဧည့်သည်များ ဝင်လာပြီး နောက်ဆက်တွဲ အလုပ်သမားများကို ခေါ်ရန် လိုအပ်သည် သို့မဟုတ် တစ်စုံတစ်ယောက်သည် ၎င်းတို့၏ အလုပ်တာဝန်များကို လျော့ရဲစေပါသည်။

နောက်ထပ်စိတ်ဝင်စားစရာကောင်းတာက ခန်းမထဲက ကုမ္ပဏီဝန်ထမ်းတွေကို ဧည့်သည်တွေနဲ့ ခွဲဖို့ပါပဲ။ ပုံမှန်အားဖြင့်၊ စနစ်သည် အချို့သောအဝတ်အစားများ (ဝတ်စုံကုဒ်) သို့မဟုတ် ထူးခြားသောအင်္ဂါရပ်များ (တံဆိပ်တပ်ထားသော ပဝါ၊ ရင်ဘတ်ပေါ်ရှိ တံဆိပ်အစရှိသည်) နှင့် ၀တ်ထားသည့်အရာများကို ခွဲခြားရန် လေ့ကျင့်ထားသည်။ ၎င်းသည် တက်ရောက်သူအား ပိုမိုတိကျစွာ အကဲဖြတ်ရန် ကူညီပေးသည် (သို့မှသာ ဝန်ထမ်းများသည် ခန်းမအတွင်းရှိ လူများ၏ စာရင်းအင်းများကို ၎င်းတို့၏ တည်ရှိနေရုံဖြင့် မဖောင်းပွစေရ)။

မျက်နှာအသိအမှတ်ပြုမှုကို အသုံးပြု၍ သင့်ပရိသတ်ကိုလည်း အကဲဖြတ်နိုင်သည်- ဧည့်သည်များ၏ သစ္စာစောင့်သိမှုကား အဘယ်နည်း၊ ဆိုလိုသည်မှာ သင်၏တည်ထောင်မှုသို့ လူမည်မျှပြန်လာပြီး အကြိမ်ရေမည်မျှဖြင့် ပြန်လာသည်ကို သင်အကဲဖြတ်နိုင်သည်။ သင့်ထံ တစ်လလျှင် ထူးထူးခြားခြားလာရောက်သူမည်မျှရှိသည်ကို တွက်ချက်ပါ။ ဆွဲဆောင်မှုနှင့် ထိန်းသိမ်းမှုဆိုင်ရာ ကုန်ကျစရိတ်များကို ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ရန်၊ ရက်သတ္တပတ်၏နေ့ရက်နှင့် နေ့အချိန်တို့ကိုပင် မူတည်၍ ယာဉ်ကြောအသွားအလာပြောင်းလဲမှုကို သင်ရှာဖွေနိုင်သည်။

ဖရန်ချိုက်များနှင့် ကွင်းဆက်ကုမ္ပဏီများသည် အမျိုးမျိုးသော လက်လီအရောင်းဆိုင်များ၏ အမှတ်တံဆိပ်တပ်ခြင်း၏ အရည်အသွေးဓာတ်ပုံများကို အခြေခံ၍ အကဲဖြတ်ချက်ကို မှာကြားနိုင်သည်- လိုဂို၊ ဆိုင်းဘုတ်များ၊ ပိုစတာများ၊ နဖူးစည်းများနှင့် အခြားအရာများ ရှိနေခြင်း။

၂.၅။ သယ်ယူပို့ဆောင်ရေးအားဖြင့်

ဗီဒီယိုခွဲခြမ်းစိတ်ဖြာမှုအသုံးပြု၍ လုံခြုံရေးအာမခံခြင်း၏နောက်ထပ်ဥပမာတစ်ခုမှာ လေဆိပ် သို့မဟုတ် ရထားဘူတာရုံများရှိ စွန့်ပစ်ပစ္စည်းများကို ဖော်ထုတ်ခြင်းဖြစ်သည်။ ရူပါရုံသည် အတန်းရာပေါင်းများစွာ၏ အရာဝတ္ထုများကို မှတ်မိရန် လေ့ကျင့်ပေးနိုင်သည်- ပရိဘောဂအပိုင်းအစများ၊ အိတ်များ၊ ခရီးဆောင်အိတ်များ၊ ထီးများ၊ အဝတ်အစားအမျိုးအစားများ၊ ပုလင်းများနှင့် အခြားအရာများ။ သင့်ဗီဒီယို ခွဲခြမ်းစိတ်ဖြာမှုစနစ်သည် ပိုင်ရှင်မဲ့အရာဝတ္တုကို တွေ့ရှိပြီး Vision ကို အသုံးပြု၍ ၎င်းကို အသိအမှတ်ပြုပါက လုံခြုံရေးဝန်ဆောင်မှုသို့ အချက်ပြမှုတစ်ခု ပေးပို့ပါသည်။ အလားတူလုပ်ဆောင်မှုတစ်ခုသည် အများသူငှာနေရာများတွင် ပုံမှန်မဟုတ်သောအခြေအနေများကို အလိုအလျောက်ရှာဖွေခြင်းနှင့် ဆက်စပ်သည်- တစ်စုံတစ်ဦးနေမကောင်းဖြစ်ခြင်း၊ သို့မဟုတ် တစ်စုံတစ်ယောက်နေရာမှားပြီး ဆေးလိပ်သောက်ခြင်း၊ သို့မဟုတ် လူတစ်ဦးသည် သံလမ်းပေါ်ပြုတ်ကျခြင်းစသည်ဖြင့် - ဤပုံစံအားလုံးကို ဗီဒီယိုခွဲခြမ်းစိတ်ဖြာမှုစနစ်များဖြင့် အသိအမှတ်ပြုနိုင်ပါသည်။ Vision API မှတဆင့်။

၂.၆။ စာရွက်စာတမ်းစီးဆင်းမှု

ကျွန်ုပ်တို့လက်ရှိလုပ်ဆောင်နေသော Vision ၏ နောက်ထပ်စိတ်ဝင်စားဖွယ်ကောင်းသော အနာဂတ်အသုံးချပရိုဂရမ်မှာ စာရွက်စာတမ်းအသိအမှတ်ပြုခြင်းနှင့် ၎င်းတို့၏ဒေတာဘေ့စ်များသို့ အလိုအလျောက်ခွဲခြမ်းစိတ်ဖြာခြင်းပင်ဖြစ်သည်။ အဆုံးမဲ့စီးရီး၊ နံပါတ်များ၊ ထုတ်ပေးသည့်ရက်စွဲများ၊ အကောင့်နံပါတ်များ၊ ဘဏ်အသေးစိတ်၊ မွေးသက္ကရာဇ်နှင့် အခြားတရားဝင်အချက်အလက်အများအပြားကို ကိုယ်တိုင်ထည့်သွင်းမည့်အစား စာရွက်စာတမ်းများကို စကင်န်ဖတ်ပြီး ၎င်းတို့ကို လုံခြုံသောချန်နယ်မှတစ်ဆင့် အလိုအလျောက်ပေးပို့နိုင်ပါသည်။ ဒေတာဘေ့စ်ထဲသို့ အလိုအလျောက်ဝင်ရောက်မှုအတွက် လိုအပ်သည့်ပုံစံဖြင့် ဒေတာဖြင့် တုံ့ပြန်မှုကို စနစ်သည် အဆိုပါစာရွက်စာတမ်းများကို ပျံသန်းစဉ်တွင် မှတ်မိမည်ဖြစ်ပြီး ၎င်းတို့ကို ခွဲခြမ်းစိပ်ဖြာကာ ဒေတာပြန်ပေးသည့်စနစ်မှ cloud သို့ API သည် ပျံသန်းပါသည်။ ယနေ့ Vision သည် စာရွက်စာတမ်းများ (PDF အပါအဝင်) အမျိုးအစားခွဲခြားနည်းကို သိထားပြီးဖြစ်သည် - နိုင်ငံကူးလက်မှတ်များ၊ SNILS၊ TIN၊ မွေးစာရင်းများ၊ အိမ်ထောင်ရေးလက်မှတ်များနှင့် အခြားအရာများအကြား ပိုင်းခြားထားပါသည်။

သေချာပါတယ်၊ အာရုံကြောကွန်ရက်က ဒီအခြေအနေတွေကို ကွက်လပ်ကနေ မကိုင်တွယ်နိုင်သေးပါဘူး။ အခြေအနေတစ်ခုစီတွင်၊ မော်ဒယ်အသစ်တစ်ခုကို တိကျသောဖောက်သည်တစ်ဦးအတွက် တည်ဆောက်ထားပြီး၊ များစွာသောအချက်များ၊ ကွဲပြားမှုများနှင့် လိုအပ်ချက်များကို ထည့်သွင်းစဉ်းစားပြီး၊ ဒေတာအစုံများကို ရွေးချယ်ကာ လေ့ကျင့်မှု၊ စမ်းသပ်မှုနှင့် ဖွဲ့စည်းမှုပုံစံများကို ထပ်ခါတလဲလဲ လုပ်ဆောင်ပါသည်။

3. API လည်ပတ်မှုအစီအစဉ်

အသုံးပြုသူများအတွက် Vision ၏ "ဝင်ပေါက်" သည် REST API ဖြစ်သည်။ ထည့်သွင်းမှုအနေဖြင့် ကွန်ရက်ကင်မရာများ (RTSP ထုတ်လွှင့်မှုများ) မှ ဓာတ်ပုံများ၊ ဗီဒီယိုဖိုင်များနှင့် ထုတ်လွှင့်မှုများကို လက်ခံရရှိနိုင်ပါသည်။

Vision ကိုအသုံးပြုရန်၊ သင်လိုအပ်သည်။ sign up ကို Mail.ru Cloud Solutions ဝန်ဆောင်မှုတွင် ဝင်ရောက်အသုံးပြုနိုင်သော တိုကင်များ (client_id + client_secret) ကို လက်ခံပါ။ OAuth ပရိုတိုကောကို အသုံးပြု၍ အသုံးပြုသူ စစ်မှန်ကြောင်းအထောက်အထားပြခြင်းကို လုပ်ဆောင်ပါသည်။ POST တောင်းဆိုမှုများ၏ အရင်းအမြစ်ဒေတာကို API သို့ ပေးပို့သည်။ တုံ့ပြန်မှုတွင်၊ client သည် JSON ဖော်မတ်တွင် အသိအမှတ်ပြုမှုရလဒ်ကို API မှ လက်ခံရရှိပြီး တုံ့ပြန်မှုကို ဖွဲ့စည်းတည်ဆောက်ထားသည်- ၎င်းတွင် တွေ့ရှိသည့်အရာဝတ္ထုများနှင့် ၎င်းတို့၏ သြဒီနိတ်များအကြောင်း အချက်အလက်ပါရှိသည်။

မုတ်ဆိတ်မွေး၊ အမှောင်မျက်မှန်နှင့် ပရိုဖိုင်တွင်- ကွန်ပျူတာအမြင်အတွက် ခက်ခဲသောအခြေအနေများ

နမူနာအဖြေ

{
   "status":200,
   "body":{
      "objects":[
         {
            "status":0,
            "name":"file_0"
         },
         {
            "status":0,
            "name":"file_2",
            "persons":[
               {
                  "tag":"person9"
                  "coord":[149,60,234,181],
                  "confidence":0.9999,
                  "awesomeness":0.45
               },
               {
                  "tag":"person10"
                  "coord":[159,70,224,171],
                  "confidence":0.9998,
                  "awesomeness":0.32
               }
            ]
         }

         {
            "status":0,
            "name":"file_3",
            "persons":[
               {
               "tag":"person11",
               "coord":[157,60,232,111],
               "aliases":["person12", "person13"]
               "confidence":0.9998,
               "awesomeness":0.32
               }
            ]
         },
         {
            "status":0,
            "name":"file_4",
            "persons":[
               {
               "tag":"undefined"
               "coord":[147,50,222,121],
               "confidence":0.9997,
               "awesomeness":0.26
               }
            ]
         }
      ],
      "aliases_changed":false
   },
   "htmlencoded":false,
   "last_modified":0
}

အဖြေတွင် စိတ်ဝင်စားဖွယ်ကောင်းသော အတိုင်းအတာတစ်ခုပါဝင်သည် - ၎င်းသည် ဓာတ်ပုံတစ်ပုံတွင်ရှိသော မျက်နှာတစ်ခု၏ အခြေအနေအရ "အေးမြခြင်း" ဖြစ်သည်၊ ၎င်းသည် အစီအစဥ်မှ မျက်နှာတစ်ခု၏ အကောင်းဆုံးရိုက်ချက်အား ကျွန်ုပ်တို့ရွေးချယ်ရာတွင် ၎င်း၏အကူအညီဖြင့် ၎င်း၏အကူအညီဖြင့် ဖြစ်သည်။ လူမှုကွန်ရက်ပေါ်တွင် ဓာတ်ပုံတစ်ပုံကို လိုက်ခ်လုပ်မည့် ဖြစ်နိုင်ခြေကို ခန့်မှန်းရန် အာရုံကြောကွန်ရက်တစ်ခုကို ကျွန်ုပ်တို့ လေ့ကျင့်သင်ကြားပေးခဲ့သည်။ ဓာတ်ပုံအရည်အသွေးပိုကောင်းလေ၊ မျက်နှာပြုံးလေလေ၊ အံ့သြစရာကောင်းလေဖြစ်သည်။

API Vision သည် space ဟုခေါ်သော သဘောတရားကို အသုံးပြုသည်။ ၎င်းသည် မတူညီသော မျက်နှာအစုံများကို ဖန်တီးရန်အတွက် ကိရိယာတစ်ခုဖြစ်သည်။ နေရာလပ်များ၏ ဥပမာများသည် အဖြူအမည်းစာရင်းများ၊ ဧည့်သည်များစာရင်းများ၊ ဝန်ထမ်းများ၊ ဖောက်သည်များ စသည်တို့ဖြစ်သည်။ Vision ရှိ တိုကင်တစ်ခုစီအတွက်၊ နေရာလွတ် 10 ခုအထိ ဖန်တီးနိုင်သည်၊ နေရာတစ်ခုစီတွင် PersonIDs 50 အထိ ရှိနိုင်သည်၊ ဆိုလိုသည်မှာ 500 အထိ၊ တိုကင်တစ်ခု။ ထို့အပြင်၊ အကောင့်တစ်ခုလျှင် တိုကင်အရေအတွက် အကန့်အသတ်မရှိပါ။

ယနေ့ API သည် အောက်ပါရှာဖွေတွေ့ရှိမှုနှင့် အသိအမှတ်ပြုမှုနည်းလမ်းများကို ပံ့ပိုးပေးသည်-

  • အသိအမှတ်ပြု/သတ်မှတ် - မျက်နှာများကို ထောက်လှမ်းခြင်းနှင့် အသိအမှတ်ပြုခြင်း။ သီးခြားလူတစ်ဦးစီထံ PersonID ကို အလိုအလျောက်သတ်မှတ်ပေးကာ PersonID နှင့် တွေ့ရှိသူများ၏ သြဒီနိတ်များကို ပြန်ပေးသည်။
  • ဖျက်ခြင်း - ပုဂ္ဂိုလ်ရေးဒေတာဘေ့စ်မှ သီးခြား PersonID ကို ဖျက်ခြင်း။
  • Truncate - PersonID မှ space တစ်ခုလုံးကို ရှင်းလင်းပေးသည်၊ ၎င်းကို စမ်းသပ်နေရာအဖြစ် အသုံးပြုခဲ့လျှင် အသုံးဝင်ပြီး ထုတ်လုပ်ရန်အတွက် ဒေတာဘေ့စ်ကို ပြန်လည်သတ်မှတ်ရန် လိုအပ်ပါသည်။
  • ထောက်လှမ်းခြင်း - အရာဝတ္ထုများ၊ မြင်ကွင်းများ၊ လိုင်စင်ပြားများ၊ မှတ်တိုင်များ၊ တန်းစီခြင်း စသည်တို့ကို ထောက်လှမ်းပါ။ တွေ့ရှိသည့်အရာများ၏ အတန်းအစားနှင့် ၎င်းတို့၏ သြဒီနိတ်များကို ပြန်ပေးသည်
  • စာရွက်စာတမ်းများအတွက်ထောက်လှမ်း - ရုရှားဖက်ဒရေးရှင်း၏တိကျသောစာရွက်စာတမ်းအမျိုးအစားများ (ပတ်စပို့၊ SNILS၊ အခွန်သက်သေခံနံပါတ်၊ စသည်ဖြင့်) ခွဲခြားသည်။

မကြာမီတွင် ကျွန်ုပ်တို့သည် OCR အတွက် နည်းလမ်းများ၊ ကျား၊ မ၊ အသက်နှင့် စိတ်ခံစားမှုများကို ဆုံးဖြတ်ခြင်းအပြင် စတိုးဆိုင်များတွင် ကုန်ပစ္စည်းများပြသမှုကို အလိုအလျောက် ထိန်းချုပ်ရန်အတွက် အရောင်းအ၀ယ်ပြဿနာများကို ဖြေရှင်းနိုင်မည်ဖြစ်သည်။ API စာရွက်စာတမ်းအပြည့်အစုံကို ဤနေရာတွင် ရှာတွေ့နိုင်ပါသည်။ https://mcs.mail.ru/help/vision-api

၈။ နိဂုံး

ယခုအခါ၊ အများသူငှာ API မှတစ်ဆင့်၊ ဓာတ်ပုံများနှင့် ဗီဒီယိုများတွင် မျက်နှာမှတ်သားမှုကို သင်ဝင်ရောက်ကြည့်ရှုနိုင်သည်၊ အရာဝတ္ထုအမျိုးမျိုး၊ လိုင်စင်နံပါတ်ပြား၊ အထင်ကရနေရာများ၊ စာရွက်စာတမ်းများနှင့် မြင်ကွင်းတစ်ခုလုံးကို ဖော်ထုတ်ခြင်းကို ပံ့ပိုးထားသည်။ လျှောက်လွှာအခြေအနေများ - ပင်လယ်။ လာပါ၊ ကျွန်ုပ်တို့၏ဝန်ဆောင်မှုကို စမ်းသပ်ပါ၊ ၎င်းကို အခက်ခဲဆုံးအလုပ်များကို သတ်မှတ်လိုက်ပါ။ ပထမဆုံး ငွေပေးငွေယူ 5000 သည် အခမဲ့ဖြစ်သည်။ သင့်ပရောဂျက်များအတွက် "ပျောက်နေသောပါဝင်ပစ္စည်း" ဖြစ်ကောင်းဖြစ်နိုင်သည်။

မှတ်ပုံတင်ခြင်းနှင့် ချိတ်ဆက်မှုတွင် သင်သည် API ကိုချက်ချင်းဝင်ရောက်နိုင်သည်။ ဗျာဒိတ်ရူပါရုံ. Habra အသုံးပြုသူအားလုံးသည် အပိုငွေပေးငွေယူများအတွက် ပရိုမိုးရှင်းကုဒ်တစ်ခု ရရှိသည်။ ကျေးဇူးပြု၍ သင့်အကောင့်ကို စာရင်းသွင်းရန် အသုံးပြုခဲ့သည့် အီးမေးလ်လိပ်စာကို ကျွန်ုပ်ထံ ရေးပေးပါ။

source: www.habr.com

DDoS ကာကွယ်ရေး၊ VPS VDS ဆာဗာများပါသည့် ဆိုက်များအတွက် ယုံကြည်စိတ်ချရသော hosting ကို ဝယ်ယူပါ။ 🔥 DDoS ကာကွယ်မှု၊ VPS VDS ဆာဗာများပါရှိသော ယုံကြည်စိတ်ချရသော ဝဘ်ဆိုက် hosting ကို ဝယ်ယူပါ | ProHoster