Nuovo sistema di riconoscimento ottico del testo EasyOCR

progetto EasyOCR È in fase di sviluppo un nuovo sistema di riconoscimento ottico del testo che supporta più di 40 lingue, tra cui inglese, tedesco, francese, giapponese, cinese, coreano, uzbeko, azero e lituano. Le lingue basate sul cirillico non sono ancora supportate, ma verranno aggiunte all'elenco dei piani. Il codice è scritto in Python utilizzando il framework PyTorch и distribuito da concesso in licenza con Apache 2.0. Per il caricamento fornito modelli già pronti per lingue basati sull'alfabeto latino e sui geroglifici.

I metodi di apprendimento automatico vengono utilizzati per identificare e riconoscere il testo in un'immagine. Un algoritmo di apprendimento automatico viene utilizzato per identificare il testo CRAFT (Consapevolezza della regione del carattere per il testo) in implementazione per PyTorch, in grado di evidenziare testo su oggetti arbitrari, comprese etichette, segnali informativi e segnali stradali. Una rete neurale ricorrente convoluzionale viene utilizzata per riconoscere sequenze di caratteri CRNN (Convolutional Recurrent Neural Network, una combinazione di DCNN e RNN) e algoritmo Ricerca fascio CTC CTC BeamSearch (Connectionist Temporal Classification) per decodificare l'output della rete neurale in rappresentazione testuale.

Fonte: opennet.ru

Aggiungi un commento