A Tesseract szövegfelismerő rendszer kiadása 5.1

Megjelent a Tesseract 5.1 optikai szövegfelismerő rendszer kiadása, amely támogatja az UTF-8 karakterek és szövegek felismerését több mint 100 nyelven, köztük orosz, kazah, fehérorosz és ukrán nyelven. Az eredmény elmenthető egyszerű szövegben vagy HTML (hOCR), ALTO (XML), PDF és TSV formátumban. A rendszert eredetileg 1985-1995-ben hozták létre a Hewlett Packard laboratóriumában, majd 2005-ben az Apache licenc alatt megnyílt a kód, és a Google munkatársainak közreműködésével továbbfejlesztették. A projekt forráskódja az Apache 2.0 licenc alatt kerül terjesztésre.

A Tesseract tartalmaz egy konzol segédprogramot és a libtesseract könyvtárat az OCR funkciók más alkalmazásokba való beágyazásához. A Tesseractot támogató, harmadik féltől származó grafikus felhasználói felületek közé tartozik a gImageReader, a VietOCR és a YAGF. Két felismerő motort kínálnak: egy klasszikust, amely egyedi karakterminták szintjén ismeri fel a szöveget, és egy újat, amely egy LSTM ismétlődő neurális hálózaton alapuló gépi tanulási rendszeren alapul, amely teljes karakterláncok felismerésére van optimalizálva, és lehetővé teszi a a pontosság jelentős növekedése. Kész, betanított modelleket tettek közzé 123 nyelvre. A teljesítmény optimalizálása érdekében OpenMP és SIMD utasításokat használó modulokat kínálnak: AVX2, AVX, NEON vagy SSE4.1.

A Tesseract 5.1 főbb fejlesztései:

  • Megvalósult a képekkel és vonalakkal ellátott területek feldolgozásának képessége ALTO, hOCR és szöveges formátumban történő kiadáskor.
  • Új curl_timeout lkz curl_easy_setop paraméter hozzáadva.
  • Továbbfejlesztett építési rendszer.
  • Dolgoztunk a fel nem használt kód eltávolításán
  • Javítva a PageIterator::Orientation osztály nullmutatóinak helytelen kezelése által okozott összeomlások.

Forrás: opennet.ru

Hozzászólás