Sortie du système GNU Ocrad 0.28 OCR

Trois ans après la dernière version, le système de reconnaissance de texte Ocrad 0.28 (Optical Character Recognition), développé sous les auspices du projet GNU, a été publié. Ocrad peut être utilisé à la fois sous la forme d'une bibliothèque pour intégrer des fonctions OCR dans d'autres applications et sous la forme d'un utilitaire distinct qui, sur la base de l'image transmise à l'entrée, produit du texte en codage UTF-8 ou 8 bits.

Pour la reconnaissance optique, Ocrad utilise la méthode d'extraction de caractéristiques. Comprend un analyseur de mise en page qui vous permet de séparer correctement les colonnes et les blocs de texte dans les documents imprimés. La reconnaissance n'est prise en charge que pour les caractères des encodages "ascii", "iso-8859-9" et "iso-8859-15" (l'alphabet cyrillique n'est pas pris en charge).

Il est à noter que la nouvelle version inclut une grande partie de correctifs et d'améliorations mineurs. Le changement le plus important a été la prise en charge du format d'image PNG, implémenté à l'aide de la bibliothèque libpng, ce qui a grandement simplifié le travail avec le programme, puisqu'auparavant, seules les images aux formats PNM pouvaient être saisies.

Source: opennet.ru

Ajouter un commentaire