Κυκλοφορία του συστήματος αναγνώρισης κειμένου Tesseract 5.2

Δημοσιεύτηκε η κυκλοφορία του συστήματος οπτικής αναγνώρισης κειμένου Tesseract 5.2, το οποίο υποστηρίζει την αναγνώριση χαρακτήρων και κειμένων UTF-8 σε περισσότερες από 100 γλώσσες, συμπεριλαμβανομένων των Ρωσικών, Καζακικών, Λευκορωσικών και Ουκρανικών. Το αποτέλεσμα μπορεί να αποθηκευτεί σε απλό κείμενο ή σε μορφές HTML (hOCR), ALTO (XML), PDF και TSV. Το σύστημα δημιουργήθηκε αρχικά το 1985-1995 στο εργαστήριο Hewlett Packard· το 2005, ο κώδικας άνοιξε με την άδεια Apache και αναπτύχθηκε περαιτέρω με τη συμμετοχή υπαλλήλων της Google. Ο πηγαίος κώδικας του έργου διανέμεται με την άδεια Apache 2.0.

Το Tesseract περιλαμβάνει ένα βοηθητικό πρόγραμμα κονσόλας και τη βιβλιοθήκη libtesseract για την ενσωμάτωση της λειτουργικότητας OCR σε άλλες εφαρμογές. Οι διεπαφές GUI τρίτων που υποστηρίζουν το Tesseract περιλαμβάνουν το gImageReader, το VietOCR και το YAGF. Προσφέρονται δύο μηχανές αναγνώρισης: μια κλασική που αναγνωρίζει κείμενο σε επίπεδο μεμονωμένων μοτίβων χαρακτήρων και μια νέα που βασίζεται στη χρήση ενός συστήματος μηχανικής μάθησης που βασίζεται σε ένα επαναλαμβανόμενο νευρωνικό δίκτυο LSTM, βελτιστοποιημένο για την αναγνώριση ολόκληρων συμβολοσειρών και επιτρέπει σημαντική αύξηση της ακρίβειας. Έχουν εκδοθεί έτοιμα εκπαιδευμένα μοντέλα για 123 γλώσσες. Για βελτιστοποίηση της απόδοσης, προσφέρονται μονάδες που χρησιμοποιούν οδηγίες OpenMP και SIMD AVX2, AVX, AVX512F, NEON ή SSE4.1.

Σημαντικές βελτιώσεις στο Tesseract 5.2:

  • Προστέθηκαν βελτιστοποιήσεις που υλοποιήθηκαν χρησιμοποιώντας οδηγίες Intel AVX512F.
  • Το C API υλοποιεί μια συνάρτηση για την προετοιμασία του tesseract με τη φόρτωση ενός μοντέλου μηχανικής εκμάθησης από τη μνήμη.
  • Προστέθηκε η παράμετρος invert_threshold, η οποία καθορίζει το επίπεδο αντιστροφής των συμβολοσειρών κειμένου. Η προεπιλεγμένη τιμή είναι 0.7. Για να απενεργοποιήσετε την αντιστροφή, ορίστε την τιμή σε 0.
  • Βελτιωμένη επεξεργασία πολύ μεγάλων εγγράφων σε κεντρικούς υπολογιστές 32 bit.
  • Η μετάβαση έγινε από τη χρήση συναρτήσεων std::regex σε std::string.
  • Βελτιωμένα σενάρια κατασκευής για Autotools, CMake και συστήματα συνεχούς ενοποίησης.

    Πηγή: opennet.ru

Προσθέστε ένα σχόλιο