Izdanje GNU Ocrad 0.28 OCR sustava

Nakon tri godine od posljednjeg izdanja, izašao je Ocrad 0.28 (Optical Character Recognition) sustav za prepoznavanje teksta, razvijen pod okriljem GNU projekta. Ocrad se može koristiti i u obliku knjižnice za integraciju OCR funkcija u druge aplikacije i u obliku zasebnog uslužnog programa koji, na temelju slike proslijeđene na ulaz, proizvodi tekst u UTF-8 ili 8-bitnom kodiranju.

Za optičko prepoznavanje Ocrad koristi metodu izdvajanja značajki. Uključuje analizator izgleda stranice koji vam omogućuje ispravno odvajanje stupaca i blokova teksta u ispisanim dokumentima. Prepoznavanje je podržano samo za znakove iz "ascii", "iso-8859-9" i "iso-8859-15" kodiranja (nema podrške za ćirilicu).

Napominje se da novo izdanje uključuje velik dio manjih popravaka i poboljšanja. Najznačajnija promjena bila je podrška za PNG format slike, implementiran pomoću libpng biblioteke, što je uvelike pojednostavilo rad s programom, budući da su se prije mogle unositi samo slike u PNM formatima.

Izvor: opennet.ru

Dodajte komentar