Νέο σύστημα οπτικής αναγνώρισης κειμένου EasyOCR

έργο EasyOCR Αναπτύσσεται ένα νέο σύστημα οπτικής αναγνώρισης κειμένου που υποστηρίζει περισσότερες από 40 γλώσσες, συμπεριλαμβανομένων των Αγγλικών, Γερμανικών, Γαλλικών, Ιαπωνικών, Κινέζων, Κορεατικών, Ουζμπεκικών, Αζερμπαϊτζάν και Λιθουανικών. Οι γλώσσες που βασίζονται στα κυριλλικά δεν υποστηρίζονται ακόμη, αλλά προστίθενται στη λίστα των σχεδίων. Ο κώδικας είναι γραμμένος σε Python χρησιμοποιώντας το πλαίσιο PyTorch и διανέμονται από άδεια σύμφωνα με το Apache 2.0. Για φόρτωση ΠΑΡΕΧΟΝΤΑΙ έτοιμα μοντέλα για γλώσσες με βάση το λατινικό αλφάβητο και τα ιερογλυφικά.

Οι μέθοδοι μηχανικής μάθησης χρησιμοποιούνται για την αναγνώριση και αναγνώριση κειμένου σε μια εικόνα. Ένας αλγόριθμος μηχανικής μάθησης χρησιμοποιείται για την αναγνώριση κειμένου ΣΚΆΦΟΣ (Character-Region Awareness For Text) σε εκτέλεση για το PyTorch, ικανό να επισημαίνει κείμενο σε αυθαίρετα αντικείμενα, συμπεριλαμβανομένων ετικετών, πινακίδων πληροφοριών και οδικών πινακίδων. Ένα συνελικτικό επαναλαμβανόμενο νευρωνικό δίκτυο χρησιμοποιείται για την αναγνώριση ακολουθιών χαρακτήρων CRNN (Συνελικτικό επαναλαμβανόμενο νευρωνικό δίκτυο, συνδυασμός DCNN και RNN) και αλγόριθμος CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) για την αποκωδικοποίηση της εξόδου νευρωνικού δικτύου σε αναπαράσταση κειμένου.

Πηγή: opennet.ru

Προσθέστε ένα σχόλιο