Nouveau système de reconnaissance optique de texte EasyOCR

projet FacileOCR Un nouveau système de reconnaissance optique de texte est en cours de développement et prend en charge plus de 40 langues, dont l'anglais, l'allemand, le français, le japonais, le chinois, le coréen, l'ouzbek, l'Azerbaïdjan et le lituanien. Les langues basées sur le cyrillique ne sont pas encore prises en charge, mais elles sont ajoutées à la liste des plans. Le code est écrit en Python en utilisant le framework PyTorch и distribué par sous licence Apache 2.0. Pour le chargement fourni modèles prêts à l'emploi pour les langues basées sur l'alphabet latin et les hiéroglyphes.

Les méthodes d'apprentissage automatique sont utilisées pour identifier et reconnaître le texte dans une image. Un algorithme d'apprentissage automatique est utilisé pour identifier le texte CRAFT (Conscience des caractères et des régions pour le texte) dans mise en oeuvre pour PyTorch, capable de mettre en évidence du texte sur des objets arbitraires, notamment des étiquettes, des panneaux d'information et des panneaux routiers. Un réseau neuronal convolutif récurrent est utilisé pour reconnaître des séquences de caractères CRNN (Convolutional Recurrent Neural Network, une combinaison de DCNN et RNN) et algorithme Recherche de faisceau CTC CTC BeamSearch (Classification temporelle connexionniste) pour décoder la sortie du réseau neuronal en représentation textuelle.

Source: opennet.ru

Ajouter un commentaire