Verëffentlechung vum Texterkennungssystem Tesseract 4.1

Preparéiert Verëffentlechung vum opteschen Texterkennungssystem Tesseract 4.1, Ënnerstëtzung Unerkennung vun UTF-8 Zeechen an Texter a méi wéi 100 Sproochen, dorënner Russesch, KasacheschName, Wäissrussland an Ukrainesch. D'Resultat kann am Einfachen Text oder an HTML (hOCR), ALTO (XML), PDF an TSV Formater gespäichert ginn. De System gouf ursprénglech am 1985-1995 am Hewlett Packard Laboratoire am Joer 2005 erstallt, de Code gouf ënner der Apache Lizenz opgemaach a gouf mat der Participatioun vu Google Mataarbechter weider entwéckelt. Projet Quellen ausbreeden lizenzéiert ënner Apache 2.0.

Tesseract enthält e Konsol Utility an d'libtesseract Bibliothéik fir OCR Funktionalitéit an aner Uwendungen z'integréieren. Vun Drëtt Parteien déi Tesseract ënnerstëtzen GUI Schnëttplazen Dir kënnt notéieren gImageReader, VietOCR и YAGF. Zwee Unerkennungsmotore ginn ugebueden: e klassesche deen Text um Niveau vun eenzelne Charaktermuster erkennt, an en neien baséiert op der Notzung vun engem Maschinnléieresystem baséiert op engem LSTM widderhuelend neuralt Netzwierk, optiméiert fir ganz Strings z'erkennen an erlaabt eng bedeitend Erhéijung vun der Genauegkeet. Ready-made trainéiert Modeller ginn publizéiert fir 123 Sproochen. Fir d'Performance ze optimiséieren, ginn Moduler mat OpenMP an AVX2, AVX oder SSE4.1 SIMD Instruktioune ugebueden.

Haaptstrooss Verbesserungen an Tesseract 4.1:

  • D'Fäegkeet bäigefüügt fir am XML-Format auszeginn HIGH (Analyse Layout an Textobjekt). Fir dëst Format ze benotzen, sollt Dir d'Applikatioun als "tessaract image_name alto output_dir" lafen;
  • Nei Rendering Moduler LSTMBox a WordStrBox bäigefüügt, vereinfacht Motortraining;
  • Zousätzlech Ënnerstëtzung fir Pseudographik am hOCR (HTML) Output;
  • Alternativ Scripte bäigefüügt, geschriwwen am Python fir de Motor ze trainéieren baséiert op Maschinnléieren;
  • Erweidert Optimisatiounen mat AVX, AVX2 an SSE Instruktiounen;
  • OpenMP Support ass par défaut ausgeschalt wéinst Problemer mat Produktivitéit;
  • Zousätzlech Ënnerstëtzung fir wäiss a schwaarz Lëschten am LSTM Motor;
  • Verbesserte Build Scripte baséiert op Cmake.

Source: opennet.ru

Setzt e Commentaire