စာသားအသိအမှတ်ပြုစနစ် Tesseract 4.1 ကိုဖြန့်ချိသည်။

ပြင်ဆင်ထားတယ်။ optical text recognition စနစ် ထုတ်ပေးခြင်း။ Tesseract 4.1ရုရှား၊ ကာဇတ်၊ ဘီလာရုနှင့် ယူကရိန်းအပါအဝင် ဘာသာစကား 8 ကျော်ဖြင့် UTF-100 စာလုံးနှင့် စာသားများကို အသိအမှတ်ပြုမှုကို ပံ့ပိုးပေးသည်။ ရလဒ်ကို ရိုးရိုးစာသား သို့မဟုတ် HTML (hOCR)၊ ALTO (XML)၊ PDF နှင့် TSV ဖော်မတ်များဖြင့် သိမ်းဆည်းနိုင်သည်။ စနစ်ကို Hewlett Packard ဓာတ်ခွဲခန်းတွင် 1985-1995 တွင် မူလက ဖန်တီးခဲ့ပြီး 2005 ခုနှစ်တွင် ကုဒ်ကို Apache လိုင်စင်အောက်တွင် ဖွင့်လှစ်ခဲ့ပြီး Google ဝန်ထမ်းများ၏ ပူးပေါင်းပါဝင်မှုဖြင့် ထပ်မံတီထွင်ခဲ့သည်။ စီမံကိန်းသတင်းရင်းမြစ် ကူးစက်ပျံ့နှံ့သည် Apache 2.0 အောက်တွင် လိုင်စင်ရထားသည်။

Tesseract တွင် အခြားအပလီကေးရှင်းများထဲသို့ OCR လုပ်ဆောင်ချက်ကို ထည့်သွင်းရန်အတွက် ကွန်ဆိုး အသုံးဝင်ပုံနှင့် libtesseract စာကြည့်တိုက်တို့ ပါဝင်သည်။ Tesseract ကိုပံ့ပိုးသောတတိယပါတီများမှ GUI အင်တာဖေ့စ်များ မှတ်သားနိုင်ပါတယ်။ gImageReader, VietOCR и YAGF. အသိအမှတ်ပြုမှုအင်ဂျင်နှစ်ခုကို ကမ်းလှမ်းသည်- တစ်ဦးချင်းဇာတ်ကောင်ပုံစံများအဆင့်တွင် စာသားကိုမှတ်မိသည့် ဂန္တဝင်တစ်ခု၊ နှင့် အသစ်တစ်ခုသည် LSTM အာရုံကြောကွန်ရက်ကိုအခြေခံသည့် စက်သင်ယူမှုစနစ်အသုံးပြုမှုအပေါ်အခြေခံ၍ အသစ်တစ်ခု၊ strings တစ်ခုလုံးကို အသိအမှတ်ပြုရန်နှင့် ခွင့်ပြုရန်အတွက် အကောင်းဆုံးဖြစ်သည် တိကျမှုသိသိသာသာတိုးလာ။ အဆင်သင့်ဖြစ် လေ့ကျင့်ထားသော မော်ဒယ်များကို ထုတ်ဝေသည်။ ဘာသာစကား ၅၂၀. စွမ်းဆောင်ရည်ကို ပိုကောင်းအောင်ပြုလုပ်ရန်၊ OpenMP နှင့် AVX2၊ AVX သို့မဟုတ် SSE4.1 SIMD ညွှန်ကြားချက်များကို အသုံးပြုသည့် မော်ဂျူးများကို ကမ်းလှမ်းထားသည်။

အဓိက တိုးတက်မှုများ Tesseract 4.1 တွင်-

  • XML ဖော်မတ်ဖြင့် ထုတ်ပေးနိုင်စွမ်းကို ထည့်သွင်းထားသည်။ Alto (ခွဲခြမ်းစိတ်ဖြာပြီး Layout နှင့် Text Object)။ ဤဖော်မတ်ကို အသုံးပြုရန်၊ သင်သည် အပလီကေးရှင်းကို “tessaract image_name alto output_dir” အဖြစ် လုပ်ဆောင်သင့်သည်။
  • Rendering modules အသစ်များ LSTMBox နှင့် WordStrBox တို့ကို ထည့်သွင်းထားပြီး အင်ဂျင်လေ့ကျင့်မှုကို ရိုးရှင်းစေသည်။
  • hOCR (HTML) output တွင် pseudographics များအတွက် ပံ့ပိုးမှု ပေါင်းထည့်ထားသည်။
  • စက်သင်ယူမှုအပေါ်အခြေခံ၍ အင်ဂျင်ကိုလေ့ကျင့်ရန်အတွက် Python တွင်ရေးထားသော အစားထိုး scripts များကို ထပ်ထည့်ထားသည်။
  • AVX၊ AVX2 နှင့် SSE ညွှန်ကြားချက်များကို အသုံးပြု၍ ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းများ ချဲ့ထွင်ခြင်း၊
  • OpenMP ပံ့ပိုးမှုအား ပုံမှန်အားဖြင့် ပိတ်ထားသည်။ ပြဿနာများ ကုန်ထုတ်စွမ်းအားနှင့်အတူ;
  • LSTM အင်ဂျင်တွင် အဖြူရောင်နှင့် အနက်ရောင်စာရင်းများအတွက် ပံ့ပိုးမှု ထပ်လောင်းထည့်သွင်းထားသည်။
  • Cmake ကို အခြေခံ၍ တည်ဆောက်ထားသော Script များကို ပိုမိုကောင်းမွန်အောင် ပြုလုပ်ထားသည်။

source: opennet.ru

မှတ်ချက် Add