Llançament del sistema de reconeixement de text Tesseract 5.2

S'ha publicat el llançament del sistema de reconeixement òptic de text Tesseract 5.2, que admet el reconeixement de caràcters i textos UTF-8 en més de 100 idiomes, inclosos el rus, el kazakh, el bielorús i l'ucraïnès. El resultat es pot desar tant en text clar com en formats HTML (hOCR), ALTO (XML), PDF i TSV. Inicialment, el sistema es va crear el 1985-1995 al laboratori de Hewlett Packard, el 2005 el codi es va obrir amb la llicència Apache i es va desenvolupar encara més amb la participació dels empleats de Google. Els textos font del projecte es distribueixen sota la llicència Apache 2.0.

Tesseract inclou una utilitat de consola i la biblioteca libtesseract per incrustar la funcionalitat OCR en altres aplicacions. Les interfícies GUI de tercers que admeten Tesseract inclouen gImageReader, VietOCR i YAGF. S'ofereixen dos motors de reconeixement: un de clàssic que reconeix el text a nivell de patrons de caràcters individuals, i un de nou basat en l'ús d'un sistema d'aprenentatge automàtic basat en una xarxa neuronal recurrent LSTM, optimitzada per reconèixer cadenes senceres i que permet una augment significatiu de la precisió. S'han publicat models preparats per a 123 idiomes. Per optimitzar el rendiment, s'ofereixen mòduls que utilitzen instruccions OpenMP i SIMD AVX2, AVX, AVX512F, NEON o SSE4.1.

Millores clau a Tesseract 5.2:

  • S'han afegit optimitzacions implementades mitjançant instruccions Intel AVX512F.
  • L'API C implementa una funció per inicialitzar tesseract amb la càrrega d'un model d'aprenentatge automàtic des de la memòria.
  • S'ha afegit el paràmetre invert_threshold, que determina el nivell d'inversió de les cadenes de text. El valor per defecte és 0.7. Per desactivar la inversió, establiu el valor a 0.
  • Processament millorat de documents molt grans en amfitrions de 32 bits.
  • La transició s'ha fet d'utilitzar les funcions std::regex a std::string.
  • Scripts de compilació millorats per a Autotools, CMake i sistemes d'integració contínua.

    Font: opennet.ru

Afegeix comentari