Nieuw optisch tekstherkenningssysteem EasyOCR

project GemakkelijkOCR Er wordt een nieuw optisch tekstherkenningssysteem ontwikkeld dat meer dan 40 talen ondersteunt, waaronder Engels, Duits, Frans, Japans, Chinees, Koreaans, Oezbeeks, Azerbeidzjaans en Litouws. Op cyrillisch gebaseerde talen worden nog niet ondersteund, maar worden toegevoegd aan de lijst met plannen. De code is geschreven in Python met behulp van het framework PyTorch и gedistribueerd door gelicentieerd onder Apache 2.0. Voor laden voorzien kant-en-klare modellen voor talen gebaseerd op het Latijnse alfabet en hiërogliefen.

Machine learning-methoden worden gebruikt om tekst in een afbeelding te identificeren en te herkennen. Om tekst te identificeren wordt een machine learning-algoritme gebruikt CRAFT (Karakterregiobewustzijn voor tekst) in implementatie voor PyTorch, in staat om tekst op willekeurige objecten te markeren, inclusief labels, informatieborden en verkeersborden. Een convolutioneel terugkerend neuraal netwerk wordt gebruikt om karakterreeksen te herkennen CRNN (Convolutional Recurrent Neural Network, een combinatie van DCNN en RNN) en algoritme CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) om neurale netwerkuitvoer te decoderen in tekstrepresentatie.

Bron: opennet.ru

Voeg een reactie