Neues optisches Texterkennungssystem EasyOCR

Projekt EasyOCR Es wird ein neues optisches Texterkennungssystem entwickelt, das mehr als 40 Sprachen unterstützt, darunter Englisch, Deutsch, Französisch, Japanisch, Chinesisch, Koreanisch, Usbekisch, Aserbaidschanisch und Litauisch. Kyrillisch-basierte Sprachen werden noch nicht unterstützt, aber sie werden der Liste der Pläne hinzugefügt. Der Code wird mithilfe des Frameworks in Python geschrieben PyTorch и vertrieben von lizenziert unter Apache 2.0. Zum Laden bereitgestellt vorgefertigte Modelle für Sprachen basierend auf dem lateinischen Alphabet und Hieroglyphen.

Methoden des maschinellen Lernens werden verwendet, um Text in einem Bild zu identifizieren und zu erkennen. Zur Identifizierung von Text wird ein maschineller Lernalgorithmus verwendet CRAFT (Zeichenregionenbewusstsein für Text) in Implementierung für PyTorch, das in der Lage ist, Text auf beliebigen Objekten hervorzuheben, einschließlich Etiketten, Hinweisschildern und Verkehrsschildern. Zur Erkennung von Zeichenfolgen wird ein faltendes rekurrentes neuronales Netzwerk verwendet CRNN (Convolutional Recurrent Neural Network, eine Kombination aus DCNN und RNN) und Algorithmus CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) zur Dekodierung neuronaler Netzwerkausgaben in Textdarstellung.

Source: opennet.ru

Kommentar hinzufügen