Dimittis textus agnitionis systematis Tesserac 5.2

Emissio Tesseract 5.2 Ratio recognitionis optici textus divulgata est, adiuvans recognitionem characterum et textuum UTF-8 plusquam 100 linguarum, inclusas Russica, Kazakh, Belarusiana et Ucraina. Effectus servari potest in textu plano aut in HTML (hOCR), ALTO (XML), PDF et TSV format. Systema in laboratorio Hewlett Packard anno 1985-1995 creatum est, anno 2005, signum sub Apache licentiae patefactum est et amplius elaboratum est cum participatione Google conductorum. Fons codicis consilii sub Apache 2.0 licentia distribuitur.

Tesseractum consolatorium utilitatem ac bibliothecam libtesseractam includit ut munus in alias applicationes OCR emundet. Tertia factio GUI interfacies quae Tesserac sustinentia includunt gImage Lector, VietOCR et YAGF. Duae recognitiones machinae exhibentur: classica una quae textum agnoscit in ambitu exemplarium singulorum characterum, et nova fundata in usu machinae systematis discendi in LSTM recurrentis retis neuralis, optimized ad chordas integras cognoscendas et permittens ad aucta subtilitate significantes. Exemplaria erudita parata facta pro 123 linguis edita sunt. Ad optimize effectus, moduli utentes OpenMP et SIMD instructiones AVX2, AVX, AVX512F, NEON vel SSE4.1 offeruntur.

Emendationes maiores in Tesserac 5.2:

  • Adiectae sunt optimizationes utentes instructiones Intel AVX512F implendas.
  • C API munus instruit ad tesseram initialandam cum machina discendi exemplar ex memoria onerantibus.
  • Addidit parametrum invert_trimenti, quod gradum inversionis textuum chordarum determinat. Valor default est 0.7. Ut inversio disable, valorem 0 pone.
  • Melioratus processus amplissimarum documentorum in 32-bit exercituum.
  • Transitus factus est ab usura std :: regex functionum ad std :: filum.
  • Improveed scripta construere pro Autotools, CMake et systemata integratione continua.

    Source: opennet.ru