Nytt optisk tekstgjenkjenningssystem EasyOCR

Prosjekt EasyOCR Et nytt optisk tekstgjenkjenningssystem er under utvikling som støtter mer enn 40 språk, inkludert engelsk, tysk, fransk, japansk, kinesisk, koreansk, usbekisk, aserbajdsjansk og litauisk. Kyrillisk-baserte språk støttes ennå ikke, men de blir lagt til listen over planer. Koden er skrevet i Python ved hjelp av rammeverket PyTorch и distribuert av lisensiert under Apache 2.0. For lasting er gitt ferdige modeller for språk basert på det latinske alfabetet og hieroglyfer.

Maskinlæringsmetoder brukes til å identifisere og gjenkjenne tekst i et bilde. En maskinlæringsalgoritme brukes til å identifisere tekst CRAFT (Karakter-regionbevissthet for tekst) i gjennomføring for PyTorch, i stand til å fremheve tekst på vilkårlige objekter, inkludert etiketter, informasjonsskilt og veiskilt. Et konvolusjonelt tilbakevendende nevralt nettverk brukes til å gjenkjenne tegnsekvenser CRNN (Convolutional Recurrent Neural Network, en kombinasjon av DCNN og RNN) og algoritme CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) for å dekode utdata fra nevrale nettverk til tekstrepresentasjon.

Kilde: opennet.ru

Legg til en kommentar