Dimittis textus agnitionis systematis Tesserac 5.3.4

Emissio Tesseract 5.3.4 Ratio recognitionis optici textus divulgata est, adiuvans recognitionem characterum et textuum UTF-8 plusquam 100 linguarum, inclusas Russica, Kazakh, Belarusiana et Ucraina. Effectus servari potest in textu plano aut in HTML (hOCR), ALTO (XML), PDF et TSV format. Systema in laboratorio Hewlett Packard anno 1985-1995 creatum est, anno 2005, signum sub Apache licentiae patefactum est et amplius elaboratum est cum participatione Google conductorum. Fons codicis consilii sub Apache 2.0 licentia distribuitur.

Tesseractum consolatorium utilitatem ac bibliothecam libtesseractam includit ut munus in alias applicationes OCR emundet. Tertia factio GUI interfacies quae Tesserac sustinentia includunt gImage Lector, VietOCR et YAGF. Duae recognitiones machinae exhibentur: classica una quae textum agnoscit in ambitu exemplarium singulorum characterum, et nova fundata in usu machinae systematis discendi in LSTM recurrentis retis neuralis, optimized ad chordas integras cognoscendas et permittens ad aucta subtilitate significantes. Exemplaria erudita parata facta pro 123 linguis edita sunt. Ad optimize effectus, moduli utentes OpenMP et SIMD instructiones AVX2, AVX, AVX512F, NEON vel SSE4.1 offeruntur.

Praecipua meliora:

  • Recognitio imaginis emendata ab URL cum fasciculo download utens bibliotheca libcurl. Cum loading, header User-Agens positum est. Novum modulum curl_cookiefile adiecit pro fasciculo crustulum utendo.
  • Servo ScrollView TCP utitur ut protocollo suo praelatus est.
  • Cum mandatum "combine_tessdata -d" utens, output praebetur ut stdout loco stderr.
  • Constitutiones fixae aedificant cum autoconf utendo et clangore.

Source: opennet.ru