Noul sistem optic de recunoaștere a textului EasyOCR

Proiect EasyOCR Se dezvoltă un nou sistem de recunoaștere optică a textului, care acceptă peste 40 de limbi, inclusiv engleză, germană, franceză, japoneză, chineză, coreeană, uzbecă, azeră și lituaniană. Limbile bazate pe chirilic nu sunt încă acceptate, dar sunt adăugate la lista de planuri. Codul este scris în Python folosind framework-ul PyTorch и distribuit de licențiat sub Apache 2.0. Pentru încărcare sunt furnizate modele gata făcute pentru limbi bazate pe alfabetul latin și hieroglife.

Metodele de învățare automată sunt folosite pentru a identifica și recunoaște textul dintr-o imagine. Un algoritm de învățare automată este utilizat pentru a identifica textul AMBARCAȚIUNILE (Conștientizarea caracterului-regiune pentru text) în implementare pentru PyTorch, capabil să evidențieze text pe obiecte arbitrare, inclusiv etichete, semne de informare și semne rutiere. O rețea neuronală recurentă convoluțională este utilizată pentru a recunoaște secvențele de caractere CRNN (Convolutional Recurrent Neural Network, o combinație de DCNN și RNN) și algoritm CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) pentru a decoda ieșirea rețelei neuronale în reprezentare text.

Sursa: opennet.ru

Adauga un comentariu