Novi sustav optičkog prepoznavanja teksta EasyOCR

Projekt EasyOCR Razvija se novi sustav optičkog prepoznavanja teksta koji podržava više od 40 jezika, uključujući engleski, njemački, francuski, japanski, kineski, korejski, uzbečki, azerbajdžanski i litvanski. Jezici koji se temelje na ćirilici još nisu podržani, ali se dodaju na popis planova. Kod je napisan u Pythonu pomoću okvira PyTorch и distribuira licenciran pod Apache 2.0. Za utovar su osigurani gotovi modeli za jezike koji se temelje na latiničnom pismu i hijeroglifima.

Metode strojnog učenja koriste se za prepoznavanje i prepoznavanje teksta na slici. Za identifikaciju teksta koristi se algoritam strojnog učenja CRAFT (Svijest o regiji znakova za tekst) u provedba za PyTorch, sposoban za isticanje teksta na proizvoljnim objektima, uključujući oznake, informativne znakove i prometne znakove. Za prepoznavanje nizova znakova koristi se konvolucijska rekurentna neuronska mreža CRNN (Convolutional Recurrent Neural Network, kombinacija DCNN i RNN) i algoritam CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) za dekodiranje izlaza neuronske mreže u prikaz teksta.

Izvor: opennet.ru

Dodajte komentar