Lançamento do sistema GNU Ocrad 0.28 OCR

Após três anos desde o último lançamento, foi lançado o sistema de reconhecimento de texto Ocrad 0.28 (Optical Character Recognition), desenvolvido sob os auspícios do projeto GNU. Ocrad pode ser usado tanto na forma de uma biblioteca para integração de funções de OCR em outros aplicativos, quanto na forma de um utilitário autônomo que, com base na imagem passada para a entrada, produz texto em UTF-8 ou 8 bits. codificações.

Para reconhecimento óptico, Ocrad usa o método de extração de recursos. Inclui um analisador de layout de página que permite separar corretamente colunas e blocos de texto em documentos impressos. O reconhecimento é suportado apenas para caracteres das codificações "ascii", "iso-8859-9" e "iso-8859-15" (não há suporte para o alfabeto cirílico).

Observa-se que a nova versão inclui uma grande parte de pequenas correções e melhorias. A mudança mais significativa foi o suporte ao formato de imagem PNG, implementado através da biblioteca libpng, o que simplificou bastante o trabalho com o programa, já que anteriormente apenas imagens nos formatos PNM podiam ser inseridas.

Fonte: opennet.ru

Adicionar um comentário