projekt Et nyt optisk tegngenkendelsessystem er under udvikling, der understøtter mere end 40 sprog, herunder engelsk, tysk, fransk, japansk, kinesisk, koreansk, usbekisk, aserbajdsjansk og litauisk. Kyrillisk-baserede sprog understøttes endnu ikke, men deres tilføjelse er i planerne. Koden er skrevet i Python ved hjælp af frameworket и under Apache 2.0-licensen. Til download færdiglavede modeller til sprog baseret på det latinske alfabet og hieroglyffer.
Maskinlæringsmetoder bruges til at identificere og genkende tekst i et billede. En maskinlæringsalgoritme bruges til at identificere teksten (Tegnområdebevidsthed for tekst) i til PyTorch, der kan fremhæve tekst på vilkårlige objekter, herunder etiketter, informationstavler og vejskilte. Et konvolutionelt tilbagevendende neuralt netværk bruges til at genkende tegnsekvenser. (Konvolutionelt tilbagevendende neuralt netværk, en kombination af DCNN og RNN) og algoritme CTC BeamSearch (Connectionist Temporal Classification) til afkodning af neurale netværksoutput til tekstrepræsentation.
Kilde: opennet.ru
