အလင်းပြန်စာသားမှတ်သားမှုစနစ် EasyOCR အသစ်

ပရောဂျက် EasyOCR အင်္ဂလိပ်၊ ဂျာမန်၊ ပြင်သစ်၊ ဂျပန်၊ တရုတ်၊ ကိုးရီးယား၊ ဥဇဘက်၊ အဇာဘိုင်ဂျနီနှင့် လစ်သူယေးနီးယားတို့အပါအဝင် ဘာသာစကား ၄၀ ကျော်ကို ပံ့ပိုးပေးသည့် optical text မှတ်သားမှုစနစ်အသစ်ကို တီထွင်လျက်ရှိသည်။ Cyrillic အခြေခံဘာသာစကားများကို မပံ့ပိုးရသေးသော်လည်း ၎င်းတို့ကို အစီအစဉ်များစာရင်းတွင် ထည့်သွင်းလျက်ရှိသည်။ ကုဒ်ကို ဘောင်ဘောင်ကို အသုံးပြု၍ Python တွင် ရေးသားထားသည်။ Pythorch и ဖြန့်ဝေသည် Apache 2.0 အောက်တွင် လိုင်စင်ရထားသည်။ loading အတွက် ထောက်ပံ့ပေးကြသည်။ လက်တင်အက္ခရာနှင့် hieroglyphs များကိုအခြေခံထားသောဘာသာစကားများအတွက်အဆင်သင့်လုပ်ထားသောမော်ဒယ်များ။

ပုံတစ်ပုံရှိ စာသားများကို ခွဲခြားသိရှိနိုင်ရန် စက်သင်ယူမှုနည်းလမ်းများကို အသုံးပြုပါသည်။ စာသားခွဲခြားသတ်မှတ်ရန် စက်သင်ယူမှု အယ်လဂိုရီသမ်ကို အသုံးပြုသည်။ Craft (Character-Region Awareness For Text) အတွက် အကောင်အထည်ဖော်ခြင်း။ PyTorch အတွက်၊ အညွှန်းများ၊ အချက်အလက် ဆိုင်းဘုတ်များနှင့် လမ်းဆိုင်းဘုတ်များ အပါအဝင် မတရားသော အရာများပေါ်တွင် စာသားကို မီးမောင်းထိုးပြနိုင်သည် ။ convolutional recurrent neural network ကို ဇာတ်ကောင် sequence များကို အသိအမှတ်ပြုရန် အသုံးပြုသည်။ CRNN (Convolutional Recurrent Neural Network၊ DCNN နှင့် RNN ပေါင်းစပ်မှု) နှင့် algorithm CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) သည် neural network output ကို စာသားကိုယ်စားပြုမှုအဖြစ် decode လုပ်ရန်။

source: opennet.ru

မှတ်ချက် Add