Rilascio del sistema OCR GNU Ocrad 0.28

Dopo tre anni dall'ultimo rilascio, Γ¨ stato rilasciato il sistema di riconoscimento testuale Ocrad 0.28 (Optical Character Recognition), sviluppato sotto gli auspici del progetto GNU. Ocrad puΓ² essere utilizzato sia sotto forma di libreria per integrare le funzioni OCR in altre applicazioni, sia sotto forma di un'utilitΓ  separata che, in base all'immagine passata all'input, produce testo con codifiche UTF-8 o 8 bit.

Per il riconoscimento ottico, Ocrad utilizza il metodo di estrazione delle caratteristiche. Include un analizzatore del layout di pagina che consente di separare correttamente colonne e blocchi di testo nei documenti stampati. Il riconoscimento Γ¨ supportato solo per i caratteri delle codifiche "ascii", "iso-8859-9" e "iso-8859-15" (non esiste supporto per l'alfabeto cirillico).

Va notato che la nuova versione include gran parte di correzioni e miglioramenti minori. Il cambiamento piΓΉ significativo Γ¨ stato il supporto per il formato immagine PNG, implementato utilizzando la libreria libpng, che ha notevolmente semplificato il lavoro con il programma, poichΓ© in precedenza si potevano inserire solo immagini nei formati PNM.

Fonte: opennet.ru

Aggiungi un commento