Dimittis textus agnitionis systematis Tesserac 5.0

Emissio Tesseract 4.1 Ratio recognitionis optici textus divulgata est, adiuvans recognitionem characterum et textuum UTF-8 plusquam 100 linguarum, inclusas Russica, Kazakh, Belarusiana et Ucraina. Effectus servari potest in textu plano aut in HTML (hOCR), ALTO (XML), PDF et TSV format. Systema in laboratorio Hewlett Packard anno 1985-1995 creatum est, anno 2005, signum sub Apache licentiae patefactum est et amplius elaboratum est cum participatione Google conductorum. Fons codicis consilii sub Apache 2.0 licentia distribuitur.

Tesseract utilitas solari includit ac bibliothecam libtesseratam ad ocr emendationem functionis in alias applicationes comprehendit. Tertia factio GUI interfacies quae Tesserac sustinentia includunt gImage Lector, VietOCR et YAGF. Duae recognitiones machinae exhibentur: classica una quae textum agnoscit in ambitu exemplarium singulorum characterum, et nova fundata in usu machinae systematis discendi in LSTM recurrentis retis neuralis, optimized ad chordas integras cognoscendas et permittens ad aucta subtilitate significantes. Exemplaria erudita parata facta pro 123 linguis edita sunt. Ad optimize effectus, moduli utentes OpenMP et SIMD instructiones AVX2, AVX, NEON vel SSE4.1 offeruntur.

Emendationes maiores in Tesserac 5.0:

  • Nota mutatio numeri in versione propter mutationes factas API quae convenientiae interrumpunt. Praesertim, in promptu publice libtesserac API non amplius ligatur ad proprietarium GenericVectoris et ad nervorum notarum genera, in favorem std:: chordae et std::vectoris.
  • Fons textus arboris ordinatus est. Documenta publica header ad includere/tesseractum presulem moti sunt.
  • Memoria procuratio redintegrata est, omnes malloc et liberi vocati cum C++ codice substituti sunt. Codicis modernisatio generalis peracta est.
  • ARM et ARM64 architecturae optimizationes additae sunt, ARM NEON instructiones ad calculas accelerandas. Optimization communis euismod omnibus architecturae explicata est.
  • Novi modi formandi exempla et recognitionem textuum in usu calculi fluitantis punctum impleverunt. Novi modi perficiendi superiorem et inferiorem memoriam consummationis offerunt. In machina LSTM, float32 modus celeriter per defaltam potens est.
  • Transitus factus est ad ordinationem Unicode utendi forma NFC (Normalizationis Canonicae) forma.
  • Addidit optionem ad detailing log configurare (--loglevel).
  • Systema constructum secundum autotools resignatum et switched ad aedificandum in modo non-recursivo.
  • "Dominus" ramus in Git renamed ad "principale".
  • Auxilia adiecit novas emissiones macOS et Apple systemata in M1 chip nixas.

    Source: opennet.ru