Lanzamento do sistema OCR GNU Ocrad 0.28

Despois de tres anos desde a última versión, lanzouse o sistema de recoñecemento de texto Ocrad 0.28 (Recoñecemento óptico de caracteres), desenvolvido baixo os auspicios do proxecto GNU. Ocrad pódese utilizar tanto en forma de biblioteca para integrar funcións OCR noutras aplicacións, como en forma de utilidade separada que, en función da imaxe pasada á entrada, produce texto en codificacións UTF-8 ou de 8 bits.

Para o recoñecemento óptico, Ocrad usa o método de extracción de características. Inclúe un analizador de deseño de páxina que permite separar correctamente columnas e bloques de texto en documentos impresos. O recoñecemento só se admite para os caracteres das codificacións "ascii", "iso-8859-9" e "iso-8859-15" (non hai soporte para o alfabeto cirílico).

Nótese que a nova versión inclúe unha gran parte de correccións e melloras menores. O cambio máis significativo foi o soporte para o formato de imaxe PNG, implementado mediante a biblioteca libpng, que simplificou moito o traballo co programa, xa que antes só se podían introducir imaxes en formato PNM.

Fonte: opennet.ru

Engadir un comentario