Κυκλοφορία του συστήματος αναγνώρισης κειμένου Tesseract 4.1

Ετοιμος απελευθέρωση του οπτικού συστήματος αναγνώρισης κειμένου Tesseract 4.1, υποστηρίζοντας την αναγνώριση χαρακτήρων UTF-8 και κειμένων σε περισσότερες από 100 γλώσσες, συμπεριλαμβανομένων των ρωσικών, του καζακικού, της λευκορωσικής και της ουκρανικής. Το αποτέλεσμα μπορεί να αποθηκευτεί σε απλό κείμενο ή σε μορφές HTML (hOCR), ALTO (XML), PDF και TSV. Το σύστημα δημιουργήθηκε αρχικά το 1985-1995 στο εργαστήριο Hewlett Packard· το 2005, ο κώδικας άνοιξε με την άδεια Apache και αναπτύχθηκε περαιτέρω με τη συμμετοχή υπαλλήλων της Google. Πηγές έργου εξάπλωση άδεια σύμφωνα με το Apache 2.0.

Το Tesseract περιλαμβάνει ένα βοηθητικό πρόγραμμα κονσόλας και τη βιβλιοθήκη libtesseract για την ενσωμάτωση της λειτουργικότητας OCR σε άλλες εφαρμογές. Από τρίτα μέρη που υποστηρίζουν την Tesseract Διεπαφές GUI μπορείτε να σημειώσετε gImageReader, VietOCR и YAGF. Προσφέρονται δύο μηχανές αναγνώρισης: μια κλασική που αναγνωρίζει κείμενο σε επίπεδο μεμονωμένων μοτίβων χαρακτήρων και μια νέα που βασίζεται στη χρήση ενός συστήματος μηχανικής μάθησης που βασίζεται σε ένα επαναλαμβανόμενο νευρωνικό δίκτυο LSTM, βελτιστοποιημένο για την αναγνώριση ολόκληρων συμβολοσειρών και επιτρέπει σημαντική αύξηση της ακρίβειας. Δημοσιεύονται έτοιμα εκπαιδευμένα μοντέλα για 123 γλώσσες. Για βελτιστοποίηση της απόδοσης, προσφέρονται μονάδες που χρησιμοποιούν οδηγίες OpenMP και AVX2, AVX ή SSE4.1 SIMD.

Ο κύριος βελτιώσεις στο Tesseract 4.1:

  • Προστέθηκε η δυνατότητα εξόδου σε μορφή XML ΥΨΗΛΟ (Αναλυμένη διάταξη και αντικείμενο κειμένου). Για να χρησιμοποιήσετε αυτήν τη μορφή, θα πρέπει να εκτελέσετε την εφαρμογή ως "tessaract image_name alto output_dir".
  • Προστέθηκαν νέες ενότητες απόδοσης LSTMBox και WordStrBox, απλοποιώντας την εκπαίδευση του κινητήρα.
  • Προστέθηκε υποστήριξη για ψευδογραφήματα στην έξοδο hOCR (HTML).
  • Προστέθηκαν εναλλακτικά σενάρια γραμμένα σε Python για την εκπαίδευση του κινητήρα με βάση τη μηχανική εκμάθηση.
  • Επεκταμένες βελτιστοποιήσεις χρησιμοποιώντας οδηγίες AVX, AVX2 και SSE.
  • Η υποστήριξη OpenMP είναι απενεργοποιημένη από προεπιλογή λόγω πρόβλημα με παραγωγικότητα?
  • Προστέθηκε υποστήριξη για λευκές και μαύρες λίστες στη μηχανή LSTM.
  • Βελτιωμένα σενάρια κατασκευής βασισμένα στο Cmake.

Πηγή: opennet.ru

Προσθέστε ένα σχόλιο