Izdanje GNU Ocrad 0.28 OCR sistema

Nakon tri godine od posljednjeg izdanja, izašao je Ocrad 0.28 (Optical Character Recognition) sistem za prepoznavanje teksta, razvijen pod okriljem GNU projekta. Ocrad se može koristiti kako u obliku biblioteke za integraciju OCR funkcija u druge aplikacije, tako iu obliku zasebnog uslužnog programa koji, na osnovu slike proslijeđene na ulaz, proizvodi tekst u UTF-8 ili 8-bitnom kodiranju.

Za optičko prepoznavanje, Ocrad koristi metodu ekstrakcije karakteristika. Uključuje analizator izgleda stranice koji vam omogućava da ispravno odvojite kolone i blokove teksta u štampanim dokumentima. Prepoznavanje je podržano samo za znakove iz kodiranja "ascii", "iso-8859-9" i "iso-8859-15" (nema podrške za ćirilično pismo).

Napominje se da novo izdanje uključuje veliki dio manjih popravki i poboljšanja. Najznačajnija promjena bila je podrška za PNG format slike, implementiran pomoću biblioteke libpng, što je uvelike pojednostavilo rad sa programom, jer su se ranije mogle unositi samo slike u PNM formatima.

izvor: opennet.ru

Dodajte komentar