စာသားအသိအမှတ်ပြုစနစ် Tesseract 5.2 ကိုဖြန့်ချိသည်။

Tesseract 5.2 optical text recognition system ကို ထုတ်ဝေခဲ့ပြီး၊ ရုရှား၊ ကာဇက်၊ ဘီလာရုနှင့် ယူကရိန်းအပါအဝင် ဘာသာစကား 8 ကျော်ဖြင့် UTF-100 စာလုံးများနှင့် စာသားများကို အသိအမှတ်ပြုခြင်းကို ပံ့ပိုးပေးထားသည်။ ရလဒ်ကို ရိုးရိုးစာသား သို့မဟုတ် HTML (hOCR)၊ ALTO (XML)၊ PDF နှင့် TSV ဖော်မတ်များဖြင့် သိမ်းဆည်းနိုင်သည်။ စနစ်ကို Hewlett Packard ၏ ဓာတ်ခွဲခန်းတွင် 1985-1995 တွင် မူလက ဖန်တီးခဲ့ပြီး 2005 ခုနှစ်တွင် ကုဒ်ကို Apache လိုင်စင်အောက်တွင် ဖွင့်လှစ်ခဲ့ပြီး Google ဝန်ထမ်းများ၏ ပူးပေါင်းပါဝင်မှုဖြင့် ထပ်မံတီထွင်ခဲ့သည်။ ပရောဂျက်၏အရင်းအမြစ်ကုဒ်ကို Apache 2.0 လိုင်စင်အောက်တွင် ဖြန့်ဝေထားသည်။

Tesseract တွင် အခြားအပလီကေးရှင်းများထဲသို့ OCR လုပ်ဆောင်ချက်ကို ထည့်သွင်းရန်အတွက် ကွန်ဆိုး အသုံးဝင်ပုံနှင့် libtesseract စာကြည့်တိုက်တို့ ပါဝင်သည်။ Tesseract ကို ပံ့ပိုးပေးသည့် ပြင်ပအဖွဲ့အစည်း GUI အင်တာဖေ့စ်များသည် gImageReader၊ VietOCR နှင့် YAGF တို့ ပါဝင်သည်။ အသိအမှတ်ပြုမှုအင်ဂျင်နှစ်ခုကို ကမ်းလှမ်းထားသည်- တစ်ဦးချင်းဇာတ်ကောင်ပုံစံများအဆင့်တွင် စာသားကိုမှတ်မိသည့် ဂန္တဝင်တစ်ခု၊ နှင့် အသစ်တစ်ခုသည် LSTM အာရုံကြောကွန်ရက်ကိုအခြေခံသည့် စက်သင်ယူမှုစနစ်အသုံးပြုမှုအပေါ်အခြေခံ၍ အသစ်တစ်ခု၊ strings တစ်ခုလုံးကို အသိအမှတ်ပြုရန်နှင့် ခွင့်ပြုရန်အတွက် အကောင်းဆုံးပြင်ဆင်ထားသည်။ တိကျမှုသိသိသာသာတိုးလာ။ အဆင်သင့်လုပ်ထားသော လေ့ကျင့်ထားသော မော်ဒယ်များကို ဘာသာစကား ၁၂၃ မျိုးဖြင့် ထုတ်ဝေခဲ့သည်။ စွမ်းဆောင်ရည်ကို ပိုကောင်းအောင်ပြုလုပ်ရန်၊ OpenMP နှင့် SIMD လမ်းညွှန်ချက်များကို AVX123၊ AVX၊ AVX2F၊ NEON သို့မဟုတ် SSE512 ကိုအသုံးပြုသည့် မော်ဂျူးများကို ကမ်းလှမ်းထားသည်။

Tesseract 5.2 တွင် အဓိကတိုးတက်မှုများ-

  • Intel AVX512F ညွှန်ကြားချက်များကို အသုံးပြု၍ ပိုမိုကောင်းမွန်အောင်လုပ်ဆောင်မှုများ ထည့်သွင်းထားသည်။
  • C API သည် memory မှ machine learning model ကို loading လုပ်ခြင်းဖြင့် tesseract ကို အစပြုရန် လုပ်ဆောင်ချက်ကို လုပ်ဆောင်ပါသည်။
  • စာသားလိုင်းများ၏ ပြောင်းပြန်လှန်ခြင်းအဆင့်ကို ဆုံးဖြတ်ပေးသည့် invert_threshold ကန့်သတ်ဘောင်ကို ထည့်သွင်းခဲ့သည်။ မူရင်းတန်ဖိုးသည် 0.7 ဖြစ်သည်။ ပြောင်းပြန်လှန်ခြင်းကို ပိတ်ရန်၊ တန်ဖိုးကို 0 ဟု သတ်မှတ်ပါ။
  • 32-bit host များပေါ်တွင် အလွန်ကြီးမားသော စာရွက်စာတမ်းများကို ပိုမိုကောင်းမွန်အောင် လုပ်ဆောင်ခြင်း။
  • std::regex လုပ်ဆောင်ချက်များကို အသုံးပြုခြင်းမှ std::string သို့ ပြောင်းလဲခြင်းအား ပြုလုပ်ထားပါသည်။
  • Autotools၊ CMake နှင့် စဉ်ဆက်မပြတ် ပေါင်းစပ်စနစ်များအတွက် ပိုမိုကောင်းမွန်သော တည်ဆောက်မှု scripts များ။

    source: opennet.ru

မှတ်ချက် Add