Lanzamiento del sistema OCR GNU Ocrad 0.28

Después de tres años desde el último lanzamiento, se lanzó el sistema de reconocimiento de texto Ocrad 0.28 (Reconocimiento óptico de caracteres), desarrollado bajo los auspicios del proyecto GNU. Ocrad se puede utilizar como una biblioteca para integrar funciones de OCR en otras aplicaciones y como una utilidad separada que, basándose en la imagen pasada a la entrada, produce texto en codificaciones UTF-8 u 8 bits.

Para el reconocimiento óptico, Ocrad utiliza el método de extracción de características. Incluye un analizador de diseño de página que permite separar correctamente columnas y bloques de texto en documentos impresos. El reconocimiento solo se admite para caracteres de las codificaciones "ascii", "iso-8859-9" e "iso-8859-15" (no hay soporte para el alfabeto cirílico).

Cabe señalar que la nueva versión incluye una gran parte de correcciones y mejoras menores. El cambio más significativo fue la compatibilidad con el formato de imagen PNG, implementado utilizando la biblioteca libpng, lo que simplificó enormemente el trabajo con el programa, ya que anteriormente solo se podían ingresar imágenes en formatos PNM.

Fuente: opennet.ru

Añadir un comentario