Κυκλοφορία του συστήματος OCR GNU Ocrad 0.28

Μετά από τρία χρόνια από την τελευταία κυκλοφορία, κυκλοφόρησε το σύστημα αναγνώρισης κειμένου Ocrad 0.28 (Optical Character Recognition), που αναπτύχθηκε υπό την αιγίδα του έργου GNU. Το Ocrad μπορεί να χρησιμοποιηθεί τόσο με τη μορφή βιβλιοθήκης για την ενσωμάτωση λειτουργιών OCR σε άλλες εφαρμογές όσο και με τη μορφή ξεχωριστού βοηθητικού προγράμματος που, με βάση την εικόνα που περνά στην είσοδο, παράγει κείμενο σε κωδικοποιήσεις UTF-8 ή 8 bit.

Για την οπτική αναγνώριση, το Ocrad χρησιμοποιεί τη μέθοδο εξαγωγής χαρακτηριστικών. Περιλαμβάνει έναν αναλυτή διάταξης σελίδας που σας επιτρέπει να διαχωρίζετε σωστά στήλες και μπλοκ κειμένου σε έντυπα έγγραφα. Η αναγνώριση υποστηρίζεται μόνο για χαρακτήρες από τις κωδικοποιήσεις "ascii", "iso-8859-9" και "iso-8859-15" (δεν υπάρχει υποστήριξη για το κυριλλικό αλφάβητο).

Σημειώνεται ότι η νέα έκδοση περιλαμβάνει ένα μεγάλο μέρος από μικρές διορθώσεις και βελτιώσεις. Η πιο σημαντική αλλαγή ήταν η υποστήριξη για τη μορφή εικόνας PNG, που υλοποιήθηκε με τη χρήση της βιβλιοθήκης libpng, η οποία απλοποίησε σημαντικά την εργασία με το πρόγραμμα, καθώς προηγουμένως μπορούσαν να εισαχθούν μόνο εικόνες σε μορφές PNM.

Πηγή: opennet.ru

Προσθέστε ένα σχόλιο