Pagpagawas sa Tesseract 5.2 nga sistema sa pag-ila sa teksto

Ang pagpagawas sa Tesseract 5.2 optical text recognition system gimantala, nga nagsuporta sa pag-ila sa UTF-8 nga mga karakter ug mga teksto sa labaw sa 100 ka mga pinulongan, lakip ang Russian, Kazakh, Belarusian ug Ukrainian. Ang resulta mahimong ma-save sa tin-aw nga teksto ug sa HTML (hOCR), ALTO (XML), PDF ug TSV nga mga format. Sa sinugdan, ang sistema gimugna sa 1985-1995 sa laboratoryo sa Hewlett Packard, sa 2005 ang code giablihan ubos sa Apache nga lisensya ug dugang nga naugmad uban sa partisipasyon sa mga empleyado sa Google. Ang gigikanan nga mga teksto sa proyekto giapod-apod sa ilawom sa lisensya sa Apache 2.0.

Ang Tesseract naglakip sa usa ka console utility ug ang libtesseract library alang sa pag-embed sa OCR functionality ngadto sa ubang mga aplikasyon. Ang mga interface sa third-party nga GUI nga nagsuporta sa Tesseract naglakip sa gImageReader, VietOCR ug YAGF. Duha ka makina sa pag-ila ang gitanyag: usa ka klasiko nga nag-ila sa teksto sa lebel sa indibidwal nga mga sumbanan sa karakter, ug usa ka bag-o nga gibase sa paggamit sa usa ka sistema sa pagkat-on sa makina nga gibase sa usa ka nagbalikbalik nga neural network sa LSTM, na-optimize alang sa pag-ila sa tibuuk nga mga kuwerdas ug gitugotan ang usa ka mahinungdanon nga pagtaas sa katukma. Ang andam na nga gibansay nga mga modelo gipatik alang sa 123 ka mga pinulongan. Aron ma-optimize ang pasundayag, gitanyag ang mga module gamit ang OpenMP ug SIMD nga mga panudlo AVX2, AVX, AVX512F, NEON o SSE4.1.

Panguna nga mga pag-uswag sa Tesseract 5.2:

  • Gidugang nga mga pag-optimize nga gipatuman gamit ang mga panudlo sa Intel AVX512F.
  • Ang C API nagpatuman sa usa ka function sa pagsugod sa tesseract sa loading sa usa ka machine learning model gikan sa memorya.
  • Gidugang ang invert_threshold parameter, nga nagtino sa lebel sa inversion sa mga string sa teksto. Ang default nga kantidad mao ang 0.7. Aron ma-disable ang inversion, ibutang ang bili sa 0.
  • Gipauswag nga pagproseso sa dako kaayo nga mga dokumento sa 32-bit nga mga host.
  • Ang transisyon gihimo gikan sa paggamit sa std::regex functions ngadto sa std::string.
  • Gipauswag nga mga script sa paghimo alang sa Autotools, CMake ug padayon nga mga sistema sa panagsama.

    Source: opennet.ru

Idugang sa usa ka comment