🥇Nuovo sistema di riconoscimento ottico dei caratteri EasyOCR

Progetto EasyOCR sta emergendo un nuovo sistema di riconoscimento ottico dei caratteri che supporta oltre 40 lingue, tra cui inglese, tedesco, francese, giapponese, cinese, coreano, uzbeko, azero e lituano. Le lingue basate su cirillico non sono supportate al momento, ma sono in programma per l'aggiunta. Il codice è scritto in Python utilizzando il framework PyTorch e distribuito con licenza Apache 2.0. Per il download sono forniti modelli pronti per lingue basate sull'alfabeto latino e caratteri ideografici.

Per l'identificazione e il riconoscimento del testo nelle immagini, vengono applicati metodi di apprendimento automatico. Per identificare il testo si utilizza un algoritmo di apprendimento automatico CRAFT (Character-Region Awareness For Text) in implementazioni per PyTorch, capace di isolare il testo su oggetti casuali, tra cui etichette, segnali informativi e cartelli stradali. Per il riconoscimento delle sequenze di caratteri viene utilizzata una rete neurale convoluzionale e ricorrente CRNN (Convolutional Recurrent Neural Network, una combinazione di DCNN e RNN) e l'algoritmo CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) per decodificare i dati di output della rete neurale in una rappresentazione testuale.

Fonte: opennet.ru

Il nuovo sistema di riconoscimento ottico dei caratteri EasyOCR