Paglabas ng sistema ng pagkilala sa teksto na Tesseract 5.2

Ang paglabas ng Tesseract 5.2 optical text recognition system ay nai-publish, na sumusuporta sa pagkilala sa UTF-8 na mga character at teksto sa higit sa 100 mga wika, kabilang ang Russian, Kazakh, Belarusian at Ukrainian. Maaaring i-save ang resulta sa plain text o sa HTML (hOCR), ALTO (XML), PDF at TSV na mga format. Ang sistema ay orihinal na nilikha noong 1985-1995 sa laboratoryo ng Hewlett Packard; noong 2005, ang code ay binuksan sa ilalim ng lisensya ng Apache at higit pang binuo kasama ang paglahok ng mga empleyado ng Google. Ang source code ng proyekto ay ipinamahagi sa ilalim ng lisensya ng Apache 2.0.

Kasama sa Tesseract ang console utility at ang libtesseract library para sa pag-embed ng OCR functionality sa ibang mga application. Kasama sa mga third-party na interface ng GUI na sumusuporta sa Tesseract ang gImageReader, VietOCR at YAGF. Dalawang makina ng pagkilala ang inaalok: isang klasikong kumikilala ng teksto sa antas ng mga indibidwal na pattern ng character, at isang bago batay sa paggamit ng isang machine learning system batay sa isang LSTM na paulit-ulit na neural network, na na-optimize para sa pagkilala sa buong mga string at nagbibigay-daan para sa isang makabuluhang pagtaas sa katumpakan. Nai-publish na ang mga ready-made na sinanay na modelo para sa 123 wika. Para i-optimize ang performance, ang mga module na gumagamit ng OpenMP at SIMD na mga tagubilin ay AVX2, AVX, AVX512F, NEON o SSE4.1 ay inaalok.

Mga pangunahing pagpapabuti sa Tesseract 5.2:

  • Nagdagdag ng mga pag-optimize na ipinatupad gamit ang mga tagubilin ng Intel AVX512F.
  • Ang C API ay nagpapatupad ng isang function upang simulan ang tesseract sa pag-load ng isang machine learning model mula sa memorya.
  • Idinagdag ang invert_threshold na parameter, na tumutukoy sa antas ng inversion ng mga string ng text. Ang default na halaga ay 0.7. Para i-disable ang inversion, itakda ang value sa 0.
  • Pinahusay na pagproseso ng napakalaking dokumento sa 32-bit na mga host.
  • Ang paglipat ay ginawa mula sa paggamit ng std::regex functions sa std::string.
  • Mga pinahusay na build script para sa Autotools, CMake at tuluy-tuloy na integration system.

    Pinagmulan: opennet.ru

Magdagdag ng komento