Serbestberdana pergala naskirina nivîsê Tesseract 5.1

Serbestberdana pergala naskirina nivîsê ya optîkî Tesseract 5.1 hate weşandin, ku piştgirî dide naskirina tîp û nivîsên UTF-8 bi zêdetirî 100 zimanan, di nav de Rûsî, Kazak, Belarusî û Ukraynî. Encam dikare di nivîsa sade an di HTML (hOCR), ALTO (XML), PDF û formatên TSV de were tomar kirin. Pergal di destpêkê de di 1985-1995-an de li laboratûara Hewlett Packard hate afirandin; di 2005-an de, kod di bin lîsansa Apache de hate vekirin û bi beşdariya karmendên Google-ê bêtir hate pêşve xistin. Koda çavkaniyê ya projeyê di bin lîsansa Apache 2.0 de tê belav kirin.

Tesseract amûrek konsolê û pirtûkxaneya libtesseract vedihewîne ku fonksiyona OCR-ê di serîlêdanên din de vehewîne. Têkiliyên GUI-ya sêyemîn ên ku Tesseract piştgirî dikin gImageReader, VietOCR û YAGF hene. Du motorên naskirinê têne pêşkêş kirin: a klasîk ku nivîsê di asta qalibên karakterên kesane de nas dike, û ya nû li ser bingeha karanîna pergalek fêrbûna makîneyê ya ku li ser bingeha tora neuralî ya LSTM-ya dûbare, xweşbîn e ku ji bo naskirina tevahî rêzan xweştir e û destûr dide. zêdebûnek girîng di rastbûnê de. Ji bo 123 zimanan modelên perwerdekirî yên amade hatine weşandin. Ji bo xweşbînkirina performansê, modulên ku bi rêwerzên OpenMP û SIMD AVX2, AVX, NEON an SSE4.1 bikar tînin têne pêşkêş kirin.

Pêşveçûnên sereke di Tesseract 5.1 de:

  • Dema ku di formatên ALTO, hOCR û nivîsê de derdixin, şiyana pêvajokirina deverên bi wêne û xêzan hatine bicîh kirin.
  • Parametreya nû curl_timeout lkz curl_easy_setop lê zêde kir.
  • Pergala avakirina çêtirîn.
  • Ji bo rakirina koda ku nehatine bikaranîn xebat hatiye kirin
  • Qezayên ku ji ber nerastkirina nîşangirên null di çîna PageIterator::Orientation de çêdibin rast kirin.

Source: opennet.ru

Add a comment