hanke EasyOCR Kehitteillä on uusi optinen tekstintunnistusjärjestelmä, joka tukee yli 40 kieltä, mukaan lukien englanti, saksa, ranska, japani, kiina, korea, uzbekki, azerbaidžani ja liettua. Kyrillispohjaisia kieliä ei vielä tueta, mutta niitä lisätään suunnitelmien luetteloon. Koodi on kirjoitettu Pythonissa käyttämällä kehystä PyTorch и jakelija lisensoitu Apache 2.0:lla. Lataamista varten tarjotaan valmiita malleja kielille, jotka perustuvat latinalaisiin aakkosiin ja hieroglyfeihin.
Koneoppimismenetelmiä käytetään tekstin tunnistamiseen ja tunnistamiseen kuvassa. Tekstin tunnistamiseen käytetään koneoppimisalgoritmia CRAFT (Tekstin merkki-aluetietoisuus) sisään toteutus PyTorchille, joka pystyy korostamaan tekstiä mielivaltaisissa kohteissa, kuten tarroissa, tietokylteissä ja liikennemerkeissä. Konvoluutiota toistuvaa hermoverkkoa käytetään merkkijonojen tunnistamiseen CRNN (Convolutional Recurrent Neural Network, DCNN:n ja RNN:n yhdistelmä) ja algoritmi CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) purkaa neuroverkon lähdön tekstiesitykseen.