Prosjekt EasyOCR Et nytt optisk tekstgjenkjenningssystem er under utvikling som støtter mer enn 40 språk, inkludert engelsk, tysk, fransk, japansk, kinesisk, koreansk, usbekisk, aserbajdsjansk og litauisk. Kyrillisk-baserte språk støttes ennå ikke, men de blir lagt til listen over planer. Koden er skrevet i Python ved hjelp av rammeverket PyTorch и distribuert av lisensiert under Apache 2.0. For lasting er gitt ferdige modeller for språk basert på det latinske alfabetet og hieroglyfer.
Maskinlæringsmetoder brukes til å identifisere og gjenkjenne tekst i et bilde. En maskinlæringsalgoritme brukes til å identifisere tekst CRAFT (Karakter-regionbevissthet for tekst) i gjennomføring for PyTorch, i stand til å fremheve tekst på vilkårlige objekter, inkludert etiketter, informasjonsskilt og veiskilt. Et konvolusjonelt tilbakevendende nevralt nettverk brukes til å gjenkjenne tegnsekvenser CRNN (Convolutional Recurrent Neural Network, en kombinasjon av DCNN og RNN) og algoritme CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) for å dekode utdata fra nevrale nettverk til tekstrepresentasjon.