Serbestberdana pergala naskirina nivîsê Tesseract 4.1

Amade kirin serbestberdana pergala naskirina nivîsê ya optîkî Tesseract 4.1, piştgirî dide naskirina tîp û nivîsên UTF-8 bi zêdetirî 100 zimanan, di nav de rûsî, kazakî, belarûsî û ukraynî. Encam dikare di nivîsa sade an di HTML (hOCR), ALTO (XML), PDF û formatên TSV de were tomar kirin. Pergal di destpêkê de di 1985-1995 de di laboratûara Hewlett Packard de di sala 2005-an de hate afirandin, kod di bin lîsansa Apache de hate vekirin û bi beşdariya karmendên Google-ê bêtir hate pêşve xistin. Çavkaniyên projeyê belavbûn lîsansa di bin Apache 2.0.

Tesseract karûbarek konsolê û pirtûkxaneya libtesseract vedihewîne ku fonksiyona OCR-ê di nav sepanên din de bicîh bike. Ji aliyên sêyemîn ên ku Tesseract piştgirî dikin Navrûyên GUI tu dikarî bibînî gImageReader, VietOCR и YAGF. Du motorên naskirinê têne pêşkêş kirin: yeka klasîk ku nivîsê di asta qalibên karakterên kesane de nas dike, û ya nû li ser bingeha karanîna pergalek fêrbûna makîneyê ya ku li ser bingeha tora neuralî ya LSTM-ya dûbare, xweşbîn e ku ji bo naskirina tevahî rêzan xweştir e û destûr dide. zêdebûna girîng di rastbûna. Modelên perwerdekirî yên amade têne weşandin 123 ziman. Ji bo xweşbînkirina performansê, modulên ku OpenMP û AVX2, AVX an SSE4.1 talîmatên SIMD bikar tînin têne pêşkêş kirin.

sereke serrastkirinî di Tesseract 4.1 de:

  • Kapasîteya derketinê di formata XML de zêde kir ALTO (Rêveberiya Analîzkirî û Tişta Nivîsar). Ji bo bikaranîna vê formatê, divê hûn serîlêdanê wekî "tessaract image_name alto output_dir" bimeşînin;
  • Modulên nûvekirinê yên LSTMBox û WordStrBox zêde kirin, perwerdehiya motorê hêsan dike;
  • Di derana hOCR (HTML) de piştgirî ji bo pseudografiyê zêde kir;
  • Ji bo perwerdekirina motorê li ser bingeha fêrbûna makîneyê nivîsarên alternatîf ên ku li Python hatine nivîsandin zêde kirin;
  • Optimîzasyonên berfireh bi karanîna rêwerzên AVX, AVX2 û SSE;
  • Ji ber vê yekê piştgirîya OpenMP ji hêla xwerû ve neçalak e pirsgirêkên bi berhemdariya;
  • Piştgiriya ji bo navnîşên spî û reş di motora LSTM de zêde kir;
  • Nivîsarên çêkirinê yên li ser bingeha Cmake çêtir kirin.

Source: opennet.ru

Add a comment