Novo sistema de recoñecemento óptico de texto EasyOCR

proxecto EasyOCR Estase a desenvolver un novo sistema de recoñecemento óptico de texto que admite máis de 40 idiomas, entre eles inglés, alemán, francés, xaponés, chinés, coreano, uzbeco, azerbaiyano e lituano. Aínda non se admiten as linguas baseadas en cirílico, pero estase engadindo á lista de plans. O código está escrito en Python usando o framework PyTorch и distribuído por licenciado baixo Apache 2.0. Para cargar se proporcionan modelos preparados para linguas baseados no alfabeto latino e xeroglíficos.

Os métodos de aprendizaxe automática utilízanse para identificar e recoñecer texto nunha imaxe. Utilízase un algoritmo de aprendizaxe automática para identificar o texto Craft (Concienciación de caracteres e rexións para o texto) en implementación para PyTorch, capaz de resaltar texto en obxectos arbitrarios, incluíndo etiquetas, sinais de información e sinais de tráfico. Utilízase unha rede neuronal recorrente convolucional para recoñecer secuencias de caracteres CRNN (Convolutional Recurrent Neural Network, unha combinación de DCNN e RNN) e algoritmo CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) para decodificar a saída da rede neuronal en representación de texto.

Fonte: opennet.ru

Engadir un comentario