Nyt optisk tekstgenkendelsessystem EasyOCR

projekt NemOCR Et nyt optisk tegngenkendelsessystem er under udvikling, der understøtter mere end 40 sprog, herunder engelsk, tysk, fransk, japansk, kinesisk, koreansk, usbekisk, aserbajdsjansk og litauisk. Kyrillisk-baserede sprog understøttes endnu ikke, men deres tilføjelse er i planerne. Koden er skrevet i Python ved hjælp af frameworket PyTorch и distribueret af under Apache 2.0-licensen. Til download leveres færdiglavede modeller til sprog baseret på det latinske alfabet og hieroglyffer.

Maskinlæringsmetoder bruges til at identificere og genkende tekst i et billede. En maskinlæringsalgoritme bruges til at identificere teksten CRAFT (Tegnområdebevidsthed for tekst) i implementering til PyTorch, der kan fremhæve tekst på vilkårlige objekter, herunder etiketter, informationstavler og vejskilte. Et konvolutionelt tilbagevendende neuralt netværk bruges til at genkende tegnsekvenser. CRNN (Konvolutionelt tilbagevendende neuralt netværk, en kombination af DCNN og RNN) og algoritme CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) til afkodning af neurale netværksoutput til tekstrepræsentation.

Kilde: opennet.ru