Lage sistèm rekonesans tèks Tesseract 5.0

Yo te pibliye piblikasyon Tesseract 4.1 sistèm nan rekonesans tèks optik, sipòte rekonesans nan karaktè UTF-8 ak tèks nan plis pase 100 lang, ki gen ladan Ris, Kazakh, Belarisyen ak Ukrainian. Rezilta a ka sove nan tèks klè oswa nan fòma HTML (hOCR), ALTO (XML), PDF ak TSV. Yo te kreye sistèm nan okòmansman an 1985-1995 nan laboratwa Hewlett Packard la; an 2005, kòd la te louvri anba lisans Apache e li te devlope plis ak patisipasyon anplwaye Google yo. Kòd sous pwojè a distribye anba lisans Apache 2.0.

Tesseract gen ladan yon sèvis piblik konsole ak bibliyotèk libtesseract pou entegre fonksyon OCR nan lòt aplikasyon. Entèfas GUI twazyèm pati ki sipòte Tesseract gen ladan gImageReader, VietOCR ak YAGF. Yo ofri de motè rekonesans: yon sèl klasik ki rekonèt tèks nan nivo modèl karaktè endividyèl yo, ak yon nouvo ki baze sou itilizasyon yon sistèm aprantisaj machin ki baze sou yon rezo neral renouvlab LSTM, ki optimize pou rekonèt kòd antye epi ki pèmèt yon ogmantasyon siyifikatif nan presizyon. Yo te pibliye modèl fòmasyon ki pare pou 123 lang. Pou optimize pèfòmans, modil ki itilize OpenMP ak SIMD enstriksyon AVX2, AVX, NEON oswa SSE4.1 yo ofri.

Gwo amelyorasyon nan Tesseract 5.0:

  • Yon chanjman enpòtan nan nimewo vèsyon an se akòz chanjman ki fèt nan API a ki kraze konpatibilite. An patikilye, API libtesseract ki disponib pou piblik la pa lye ankò ak kalite done GenericVector ak STRING, an favè std::string ak std::vector.
  • Pyebwa tèks sous la te reòganize. Fichye header piblik yo te deplase nan anyè enkli/tesseract.
  • Jesyon memwa yo te reamenaje, tout malloc ak apèl gratis yo te ranplase ak kòd C++. Yo te fè yon modènizasyon jeneral nan kòd la.
  • Te ajoute optimize pou achitekti ARM ak ARM64; enstriksyon ARM NEON yo itilize pou akselere kalkil yo. Optimizasyon pèfòmans komen nan tout achitekti yo te pote soti.
  • Nouvo mòd pou modèl fòmasyon ak rekonesans tèks ki baze sou itilizasyon kalkil pwen k ap flote yo te aplike. Nouvo mòd yo ofri pi wo pèfòmans ak pi ba konsomasyon memwa. Nan motè LSTM, mòd rapid float32 aktive pa default.
  • Yo te fè yon tranzisyon pou itilize nòmalizasyon Unicode lè l sèvi avèk fòm NFC (Fòm Normalizasyon Canonical).
  • Te ajoute yon opsyon pou konfigirasyon detaye boutèy demi lit (--loglevel).
  • Sistèm konstriksyon ki baze sou Autotools te reamenaje epi chanje pou bati nan mòd ki pa rekursif.
  • Branch "mèt" nan Git te chanje non an "prensipal".
  • Te ajoute sipò pou nouvo degaje sistèm macOS ak Apple ki baze sou chip M1 la.

    Sous: opennet.ru

Add nouvo kòmantè