Llançament del sistema OCR GNU Ocrad 0.28

Després de tres anys des de l'últim llançament, s'ha llançat el sistema de reconeixement de text Ocrad 0.28 (Reconeixement òptic de caràcters), desenvolupat sota els auspicis del projecte GNU. Ocrad es pot utilitzar tant en forma de biblioteca per integrar funcions OCR en altres aplicacions, com en forma d'utilitat independent que, a partir de la imatge que es passa a l'entrada, produeix text en codificacions UTF-8 o de 8 bits.

Per al reconeixement òptic, Ocrad utilitza el mètode d'extracció de característiques. Inclou un analitzador de disseny de pàgina que us permet separar correctament columnes i blocs de text en documents impresos. El reconeixement només s'admet per a caràcters de les codificacions "ascii", "iso-8859-9" i "iso-8859-15" (no hi ha suport per a l'alfabet ciríl·lic).

Cal assenyalar que la nova versió inclou una gran part de correccions i millores menors. El canvi més significatiu va ser el suport per al format d'imatge PNG, implementat mitjançant la biblioteca libpng, que va simplificar molt el treball amb el programa, ja que abans només es podien introduir imatges en format PNM.

Font: opennet.ru

Afegeix comentari