GNU Ocrad 0.28 OCR sistemos išleidimas

Praėjus trejiems metams nuo paskutinio išleidimo, buvo išleista Ocrad 0.28 (Optical Character Recognition) teksto atpažinimo sistema, sukurta globojant GNU projektą. „Ocrad“ gali būti naudojamas tiek kaip biblioteka, skirta OCR funkcijoms integruoti į kitas programas, tiek kaip atskira priemonė, kuri pagal įvestį perduodamą vaizdą sukuria tekstą UTF-8 arba 8 bitų koduotėmis.

Optiniam atpažinimui „Ocrad“ naudoja funkcijų ištraukimo metodą. Apima puslapio išdėstymo analizatorių, leidžiantį teisingai atskirti stulpelius ir teksto blokus spausdintuose dokumentuose. Atpažinimas palaikomas tik simboliams iš „ascii“, „iso-8859-9“ ir „iso-8859-15“ koduotės (kirilicos abėcėlė nepalaikoma).

Pažymima, kad naujajame leidime yra daug smulkių pataisymų ir patobulinimų. Svarbiausias pokytis buvo PNG vaizdo formato palaikymas, įdiegtas naudojant libpng biblioteką, o tai labai supaprastino darbą su programa, nes anksčiau buvo galima įvesti tik PNM formato vaizdus.

Šaltinis: opennet.ru

Добавить комментарий