Nowy optyczny system rozpoznawania tekstu EasyOCR

projekt ŁatwyOCR Trwają prace nad nowym systemem optycznego rozpoznawania tekstu, który obsługuje ponad 40 języków, w tym angielski, niemiecki, francuski, japoński, chiński, koreański, uzbecki, azerbejdżański i litewski. Języki oparte na cyrylicy nie są jeszcze obsługiwane, ale są dodawane do listy planów. Kod napisany jest w języku Python przy użyciu frameworka PyTorch и dystrybuowane przez licencjonowany w ramach Apache 2.0. Do załadunku są zapewnione gotowe modele języków opartych na alfabecie łacińskim i hieroglifach.

Metody uczenia maszynowego służą do identyfikowania i rozpoznawania tekstu na obrazie. Do identyfikacji tekstu używany jest algorytm uczenia maszynowego RZEMIOSŁO (Świadomość regionu znaków dla tekstu) w realizacja dla PyTorch, zdolny do podświetlania tekstu na dowolnych obiektach, w tym etykietach, znakach informacyjnych i znakach drogowych. Do rozpoznawania sekwencji znaków używana jest splotowa, rekurencyjna sieć neuronowa CRNN (Convolutional Recurrent Neural Network, połączenie DCNN i RNN) i algorytm Wyszukiwanie wiązki CTC CTC BeamSearch (koneksjonistyczna klasyfikacja czasowa) do dekodowania danych wyjściowych sieci neuronowej na reprezentację tekstową.

Źródło: opennet.ru

Dodaj komentarz