Kutolewa kwa mfumo wa utambuzi wa maandishi Tesseract 5.2

Utoaji wa mfumo wa utambuzi wa maandishi ya macho wa Tesseract 5.2 umechapishwa, ukisaidia utambuzi wa herufi na maandishi ya UTF-8 katika lugha zaidi ya 100, zikiwemo Kirusi, Kikazaki, Kibelarusi na Kiukreni. Matokeo yanaweza kuhifadhiwa kwa maandishi wazi au katika muundo wa HTML (hOCR), ALTO (XML), PDF na TSV. Mfumo huo uliundwa awali mnamo 1985-1995 katika maabara ya Hewlett Packard; mnamo 2005, nambari hiyo ilifunguliwa chini ya leseni ya Apache na iliendelezwa zaidi kwa ushiriki wa wafanyikazi wa Google. Msimbo wa chanzo wa mradi unasambazwa chini ya leseni ya Apache 2.0.

Tesseract inajumuisha matumizi ya kiweko na maktaba ya libtesseract ya kupachika utendaji wa OCR kwenye programu zingine. Njia za kuingiliana za GUI za wahusika wengine zinazotumia Tesseract ni pamoja na gImageReader, VietOCR na YAGF. Injini mbili za utambuzi hutolewa: ya kawaida ambayo inatambua maandishi katika kiwango cha muundo wa wahusika binafsi, na mpya kulingana na matumizi ya mfumo wa kujifunza kwa mashine kulingana na mtandao wa neva unaojirudia wa LSTM, ulioboreshwa kwa ajili ya kutambua mifuatano yote na kuruhusu ongezeko kubwa la usahihi. Miundo iliyotayarishwa tayari imechapishwa kwa lugha 123. Ili kuboresha utendakazi, moduli zinazotumia OpenMP na maagizo ya SIMD AVX2, AVX, AVX512F, NEON au SSE4.1 hutolewa.

Maboresho makuu katika Tesseract 5.2:

  • Uboreshaji ulioongezwa unaotekelezwa kwa kutumia maagizo ya Intel AVX512F.
  • C API hutekelezea kazi ya kuanzisha tesseract kwa kupakia kielelezo cha kujifunza kwa mashine kutoka kwenye kumbukumbu.
  • Imeongeza kigezo cha invert_threshold, ambacho huamua kiwango cha ubadilishaji wa mifuatano ya maandishi. Thamani chaguo-msingi ni 0.7. Ili kuzima ubadilishaji, weka thamani hadi 0.
  • Usindikaji ulioboreshwa wa hati kubwa sana kwenye wapangishi wa 32-bit.
  • Mpito umefanywa kutoka kwa kutumia vitendaji vya std::regex hadi std::string.
  • Hati za ujenzi zilizoboreshwa za Autotools, CMake na mifumo endelevu ya ujumuishaji.

    Chanzo: opennet.ru

Kuongeza maoni