Llançament del sistema de reconeixement de text Tesseract 4.1

Preparat llançament del sistema de reconeixement òptic de text Tesseract 4.1, que admet el reconeixement de caràcters i textos UTF-8 en més de 100 idiomes, inclosos el rus, el kazakh, el bielorús i l'ucraïnès. El resultat es pot desar en text sense format o en formats HTML (hOCR), ALTO (XML), PDF i TSV. El sistema es va crear originalment el 1985-1995 al laboratori Hewlett Packard; el 2005, el codi es va obrir amb la llicència Apache i es va desenvolupar encara més amb la participació dels empleats de Google. Fonts del projecte propagació amb llicència d'Apache 2.0.

Tesseract inclou una utilitat de consola i la biblioteca libtesseract per incrustar la funcionalitat OCR en altres aplicacions. De tercers que donen suport a Tesseract Interfícies GUI pots notar gImageReader, VietOCR и YAGF. S'ofereixen dos motors de reconeixement: un de clàssic que reconeix el text a nivell de patrons de caràcters individuals, i un de nou basat en l'ús d'un sistema d'aprenentatge automàtic basat en una xarxa neuronal recurrent LSTM, optimitzada per reconèixer cadenes senceres i permetre una augment significatiu de la precisió. Es publiquen models preparats a punt 123 idiomes. Per optimitzar el rendiment, s'ofereixen mòduls que utilitzen instruccions SIMD d'OpenMP i AVX2, AVX o SSE4.1.

El principal millores al Tesseract 4.1:

  • S'ha afegit la possibilitat de sortir en format XML ALT (Disposició i objecte de text analitzats). Per utilitzar aquest format, hauríeu d'executar l'aplicació com a "tessaract image_name alto output_dir";
  • S'han afegit nous mòduls de representació LSTMBox i WordStrBox, simplificant l'entrenament del motor;
  • S'ha afegit suport per a pseudogràfics a la sortida hOCR (HTML);
  • S'han afegit scripts alternatius escrits en Python per entrenar el motor basat en l'aprenentatge automàtic;
  • Optimitzacions ampliades mitjançant instruccions AVX, AVX2 i SSE;
  • El suport d'OpenMP està desactivat per defecte a causa de problemes amb productivitat;
  • S'ha afegit suport per a llistes blanques i negres al motor LSTM;
  • Scripts de compilació millorats basats en Cmake.

Font: opennet.ru

Afegeix comentari