Rilaxx tas-sistema ta' rikonoxximent tat-test Tesseract 5.0

Ir-rilaxx tas-sistema ta 'rikonoxximent tat-test Tesseract 4.1 ottiku ġie ppubblikat, li jappoġġja r-rikonoxximent ta' karattri UTF-8 u testi f'aktar minn 100 lingwa, inklużi r-Russu, il-Każakistan, il-Belarus u l-Ukrajna. Ir-riżultat jista' jiġi ffrankat f'test sempliċi jew f'formati HTML (hOCR), ALTO (XML), PDF u TSV. Is-sistema inħolqot oriġinarjament fl-1985-1995 fil-laboratorju Hewlett Packard; fl-2005, il-kodiċi nfetaħ taħt il-liċenzja Apache u ġie żviluppat aktar bil-parteċipazzjoni tal-impjegati ta 'Google. Il-kodiċi tas-sors tal-proġett huwa mqassam taħt il-liċenzja Apache 2.0.

Tesseract jinkludi utilità tal-console u l-librerija libtesseract għall-inkorporazzjoni tal-funzjonalità tal-OCR f'applikazzjonijiet oħra. Interfaces GUI ta 'partijiet terzi li jappoġġjaw Tesseract jinkludu gImageReader, VietOCR u YAGF. Huma offruti żewġ magni ta’ rikonoxximent: waħda klassika li tagħraf it-test fil-livell ta’ mudelli ta’ karattri individwali, u waħda ġdida bbażata fuq l-użu ta’ sistema ta’ tagħlim tal-magni bbażata fuq netwerk newrali rikorrenti LSTM, ottimizzata biex tagħraf kordi sħaħ u tippermetti żieda sinifikanti fl-eżattezza. Mudelli mħarrġa lesti ġew ippubblikati għal 123 lingwa. Biex tiġi ottimizzata l-prestazzjoni, huma offruti moduli li jużaw struzzjonijiet OpenMP u SIMD AVX2, AVX, NEON jew SSE4.1.

Titjib kbir f'Tesseract 5.0:

  • Bidla sinifikanti fin-numru tal-verżjoni hija dovuta għal bidliet li saru fl-API li jiksru l-kompatibilità. B'mod partikolari, l-API pubblika libtesseract m'għadhiex marbuta mat-tipi ta' dejta GenericVector u STRING proprjetarji, favur std::string u std::vector.
  • Is-siġra tat-test sors ġiet riorganizzata. Fajls tal-header pubbliċi ġew imċaqalqa fid-direttorju include/tesseract.
  • Il-ġestjoni tal-memorja ġiet imfassla mill-ġdid, is-sejħiet kollha malloc u b'xejn ġew sostitwiti b'kodiċi C++. Saret modernizzazzjoni ġenerali tal-kodiċi.
  • Ottimizzazzjonijiet miżjuda għall-arkitetturi ARM u ARM64; L-istruzzjonijiet ARM NEON jintużaw biex iħaffu l-kalkoli. Twettqet ottimizzazzjoni tal-prestazzjoni komuni għall-arkitetturi kollha.
  • Ġew implimentati modi ġodda għal mudelli ta' taħriġ u rikonoxximent tat-test ibbażati fuq l-użu ta' kalkoli ta' punt li jvarja. Il-modi l-ġodda joffru prestazzjoni ogħla u konsum aktar baxx tal-memorja. Fil-magna LSTM, il-modalità veloċi float32 hija attivata awtomatikament.
  • Saret transizzjoni għall-użu tan-normalizzazzjoni Unicode bl-użu tal-formola NFC (Formola ta 'Normalizzazzjoni Canonical).
  • Miżjud għażla biex jiġi kkonfigurat id-dettalji tal-ġurnal (--loglevel).
  • Is-sistema tal-bini bbażata fuq Autotools ġiet iddisinjata mill-ġdid u inbidlet biex tinbena f'modalità mhux rikursiva.
  • Il-fergħa "kaptan" f'Git ingħatat l-isem ġdid għal "prinċipali".
  • Appoġġ miżjud għal ħarġiet ġodda ta 'sistemi macOS u Apple bbażati fuq iċ-ċippa M1.

    Sors: opennet.ru

Żid kumment