Serbestberdana pergala naskirina nivîsê Tesseract 5.0

Serbestberdana pergala naskirina nivîsê ya optîkî Tesseract 4.1 hate weşandin, ku piştgirî dide naskirina tîp û nivîsên UTF-8 bi zêdetirî 100 zimanan, di nav de Rûsî, Kazak, Belarusî û Ukraynî. Encam dikare di nivîsa sade an di HTML (hOCR), ALTO (XML), PDF û formatên TSV de were tomar kirin. Pergal di destpêkê de di 1985-1995-an de li laboratûara Hewlett Packard hate afirandin; di 2005-an de, kod di bin lîsansa Apache de hate vekirin û bi beşdariya karmendên Google-ê bêtir hate pêşve xistin. Koda çavkaniyê ya projeyê di bin lîsansa Apache 2.0 de tê belav kirin.

Tesseract amûrek konsolê û pirtûkxaneya libtesseract vedihewîne ku fonksiyona OCR-ê di serîlêdanên din de vehewîne. Têkiliyên GUI-ya sêyemîn ên ku Tesseract piştgirî dikin gImageReader, VietOCR û YAGF hene. Du motorên naskirinê têne pêşkêş kirin: a klasîk ku nivîsê di asta qalibên karakterên kesane de nas dike, û ya nû li ser bingeha karanîna pergalek fêrbûna makîneyê ya ku li ser bingeha tora neuralî ya LSTM-ya dûbare, xweşbîn e ku ji bo naskirina tevahî rêzan xweştir e û destûr dide. zêdebûnek girîng di rastbûnê de. Ji bo 123 zimanan modelên perwerdekirî yên amade hatine weşandin. Ji bo xweşbînkirina performansê, modulên ku bi rêwerzên OpenMP û SIMD AVX2, AVX, NEON an SSE4.1 bikar tînin têne pêşkêş kirin.

Pêşveçûnên sereke di Tesseract 5.0 de:

  • Guherînek girîng a di hejmara guhertoyê de ji ber guheztinên ku li API-yê hatine çêkirin e ku lihevhatina dişkîne. Bi taybetî, API-ya libtesseract ya gelemperî ya berdest êdî bi celebên daneya GenericVector û STRING ve girêdayî ye, di berjewendiya std::string û std::vector de.
  • Dara nivîsa çavkaniyê ji nû ve hate organîzekirin. Pelên sernavê yên gelemperî hatin veguheztin pelrêça tevlî/tesseract.
  • Rêvebiriya bîranînê ji nû ve hatî sêwirandin, hemî bangên malloc û belaş bi koda C++ ve hatine guhertin. Nûjenkirina giştî ya kodê hate kirin.
  • Ji bo mîmariya ARM û ARM64 xweşbîniyên zêde kirin; Rêwerzên ARM NEON ji bo bilezkirina hesaban têne bikar anîn. Optimîzasyona performansê ya ji bo hemî mîmariyan hevpar pêk hatiye.
  • Modên nû yên ji bo modelên perwerdehiyê û naskirina nivîsê li ser bingeha karanîna hesabên xala herikandinê hatine bicîh kirin. Modên nû performansa bilindtir û mezaxtina bîra kêm pêşkêşî dikin. Di motora LSTM de, moda bilez a float32 ji hêla xwerû ve hatî çalak kirin.
  • Veguheztinek ji bo karanîna normalîzekirina Unicode bi karanîna forma NFC (Normalization Form Canonical) hate çêkirin.
  • Vebijêrkek zêde kir ku hûrguliyên têketinê mîheng bike (--loglevel).
  • Pergala çêkirinê ya li ser bingeha Autotools ji nû ve hatî sêwirandin û hate guherandin ku di moda ne-veger de were çêkirin.
  • Navê şaxê "master" li Git bû "sereke".
  • Piştgiriyek ji bo serbestberdanên nû yên pergalên macOS û Apple-ê yên li ser bingeha çîpê M1-ê zêde kirin.

    Source: opennet.ru

Add a comment