Uusi optinen tekstintunnistusjärjestelmä EasyOCR

hanke EasyOCR Kehitteillä on uusi optinen tekstintunnistusjärjestelmä, joka tukee yli 40 kieltä, mukaan lukien englanti, saksa, ranska, japani, kiina, korea, uzbekki, azerbaidžani ja liettua. Kyrillispohjaisia ​​kieliä ei vielä tueta, mutta niitä lisätään suunnitelmien luetteloon. Koodi on kirjoitettu Pythonissa käyttämällä kehystä PyTorch и jakelija lisensoitu Apache 2.0:lla. Lataamista varten tarjotaan valmiita malleja kielille, jotka perustuvat latinalaisiin aakkosiin ja hieroglyfeihin.

Koneoppimismenetelmiä käytetään tekstin tunnistamiseen ja tunnistamiseen kuvassa. Tekstin tunnistamiseen käytetään koneoppimisalgoritmia CRAFT (Tekstin merkki-aluetietoisuus) sisään toteutus PyTorchille, joka pystyy korostamaan tekstiä mielivaltaisissa kohteissa, kuten tarroissa, tietokylteissä ja liikennemerkeissä. Konvoluutiota toistuvaa hermoverkkoa käytetään merkkijonojen tunnistamiseen CRNN (Convolutional Recurrent Neural Network, DCNN:n ja RNN:n yhdistelmä) ja algoritmi CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) purkaa neuroverkon lähdön tekstiesitykseen.

Lähde: opennet.ru

Lisää kommentti