A GNU Ocrad 0.28 OCR rendszer kiadása

Az utolsó kiadás óta eltelt három év után megjelent a GNU projekt égisze alatt kifejlesztett Ocrad 0.28 (Optical Character Recognition) szövegfelismerő rendszer. Az Ocrad használható könyvtár formájában az OCR funkciók más alkalmazásokba való integrálására, és egy külön segédprogram formájában is, amely a bemenetre továbbított kép alapján UTF-8 vagy 8 bites kódolású szöveget állít elő.

Az optikai felismeréshez az Ocrad a funkciókivonási módszert használja. Tartalmaz egy oldalelrendezés-elemzőt, amely lehetővé teszi az oszlopok és szövegblokkok helyes elkülönítését a nyomtatott dokumentumokban. A felismerés csak az „ascii”, „iso-8859-9” és „iso-8859-15” kódolású karakterek esetében támogatott (a cirill ábécé nem támogatott).

Meg kell jegyezni, hogy az új kiadás kisebb javítások és fejlesztések nagy részét tartalmazza. A legjelentősebb változás a PNG képformátum támogatása volt, amelyet a libpng könyvtár segítségével valósítottak meg, ami jelentősen leegyszerűsítette a programmal való munkát, mivel korábban csak PNM formátumú képeket lehetett bevinni.

Forrás: opennet.ru

Hozzászólás