Nyt optisk tekstgenkendelsessystem EasyOCR

projekt EasyOCR Et nyt optisk tekstgenkendelsessystem er under udvikling, der understøtter mere end 40 sprog, herunder engelsk, tysk, fransk, japansk, kinesisk, koreansk, usbekisk, aserbajdsjansk og litauisk. Kyrillisk-baserede sprog er endnu ikke understøttet, men de føjes til listen over planer. Koden er skrevet i Python ved hjælp af frameworket PyTorch и distribueret af licenseret under Apache 2.0. Til lastning leveres færdige modeller til sprog baseret på det latinske alfabet og hieroglyffer.

Maskinlæringsmetoder bruges til at identificere og genkende tekst i et billede. En maskinlæringsalgoritme bruges til at identificere tekst CRAFT (Karakter-Region Awareness For Text) i implementering til PyTorch, der er i stand til at fremhæve tekst på vilkårlige objekter, herunder etiketter, informationsskilte og vejskilte. Et foldet tilbagevendende neuralt netværk bruges til at genkende tegnsekvenser CRNN (Convolutional Recurrent Neural Network, en kombination af DCNN og RNN) og algoritme CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) til at afkode neurale netværksoutput til tekstrepræsentation.

Kilde: opennet.ru

Tilføj en kommentar