Novo sistema óptico de reconhecimento de texto EasyOCR

projeto EasyOCRGenericName Está sendo desenvolvido um novo sistema óptico de reconhecimento de texto que suporta mais de 40 idiomas, incluindo inglês, alemão, francês, japonês, chinês, coreano, uzbeque, azerbaijano e lituano. Os idiomas baseados em cirílico ainda não são suportados, mas estão sendo adicionados à lista de planos. O código é escrito em Python usando o framework PyTorch и distribuído por licenciado sob Apache 2.0. Para carregar oferecido modelos prontos para idiomas baseados no alfabeto latino e hieróglifos.

Métodos de aprendizado de máquina são usados ​​para identificar e reconhecer texto em uma imagem. Um algoritmo de aprendizado de máquina é usado para identificar texto Ofício (Conscientização de personagem-região para texto) em implementação para PyTorch, capaz de destacar texto em objetos arbitrários, incluindo etiquetas, placas informativas e placas de trânsito. Uma rede neural recorrente convolucional é usada para reconhecer sequências de caracteres CRNN (Rede Neural Recorrente Convolucional, uma combinação de DCNN e RNN) e algoritmo CTC BeamSearch CTC BeamSearch (Classificação Temporal Conexionista) para decodificar a saída da rede neural em representação de texto.

Fonte: opennet.ru

Adicionar um comentário