Kutolewa kwa mfumo wa utambuzi wa maandishi Tesseract 4.1

Imetayarishwa kutolewa kwa mfumo wa utambuzi wa maandishi ya macho Tesseract 4.1, kusaidia utambuzi wa herufi na maandishi ya UTF-8 katika lugha zaidi ya 100, zikiwemo Kirusi, Kikazaki, Kibelarusi na Kiukreni. Matokeo yanaweza kuhifadhiwa kwa maandishi wazi au katika muundo wa HTML (hOCR), ALTO (XML), PDF na TSV. Mfumo huo uliundwa awali mnamo 1985-1995 katika maabara ya Hewlett Packard; mnamo 2005, nambari hiyo ilifunguliwa chini ya leseni ya Apache na iliendelezwa zaidi kwa ushiriki wa wafanyikazi wa Google. Vyanzo vya mradi kuenea leseni chini ya Apache 2.0.

Tesseract inajumuisha matumizi ya kiweko na maktaba ya libtesseract ya kupachika utendaji wa OCR kwenye programu zingine. Kutoka kwa wahusika wengine wanaounga mkono Tesseract miingiliano ya GUI unaweza kutambua gImageReader, VietnamOCR ΠΈ YAGF. Injini mbili za utambuzi hutolewa: ya kawaida ambayo inatambua maandishi katika kiwango cha muundo wa wahusika binafsi, na mpya kulingana na matumizi ya mfumo wa kujifunza kwa mashine kulingana na mtandao wa neva unaojirudia wa LSTM, ulioboreshwa kwa ajili ya kutambua mifuatano yote na kuruhusu ongezeko kubwa la usahihi. Miundo iliyotayarishwa tayari imechapishwa kwa ajili ya Lugha 123. Ili kuboresha utendakazi, moduli zinazotumia OpenMP na AVX2, AVX au SSE4.1 SIMD maelekezo hutolewa.

kuu maboresho katika Tesseract 4.1:

  • Imeongeza uwezo wa kutoa katika umbizo la XML ALTO (Muundo Uliochanganuliwa na Kitu cha Maandishi). Ili kutumia umbizo hili, unapaswa kuendesha programu kama "tessaract image_name alto output_dir";
  • Imeongeza moduli mpya za utoaji LTMBox na WordStrBox, kurahisisha mafunzo ya injini;
  • Msaada ulioongezwa kwa pseudographics katika pato la hOCR (HTML);
  • Aliongeza maandishi mbadala yaliyoandikwa katika Python kwa mafunzo ya injini kulingana na ujifunzaji wa mashine;
  • Uboreshaji uliopanuliwa kwa kutumia maagizo ya AVX, AVX2 na SSE;
  • Usaidizi wa OpenMP umezimwa kwa chaguo-msingi kwa sababu ya matatizo na tija;
  • Msaada ulioongezwa kwa orodha nyeupe na nyeusi kwenye injini ya LSTM;
  • Maandishi yaliyoboreshwa ya ujenzi kulingana na Cmake.

Chanzo: opennet.ru

Kuongeza maoni