Nytt optiskt textigenkänningssystem EasyOCR

projekt EasyOCR Ett nytt optiskt textigenkänningssystem håller på att utvecklas som stöder mer än 40 språk, inklusive engelska, tyska, franska, japanska, kinesiska, koreanska, uzbekiska, azerbajdzjanska och litauiska. Kyrilliska baserade språk stöds ännu inte, men de läggs till i listan över planer. Koden är skriven i Python med hjälp av ramverket PyTorch и levererad av licensierad under Apache 2.0. För lastning är försedda färdiga modeller för språk baserade på det latinska alfabetet och hieroglyfer.

Maskininlärningsmetoder används för att identifiera och känna igen text i en bild. En maskininlärningsalgoritm används för att identifiera text FARKOSTER (Tecken-Region Awareness For Text) in genomförande för PyTorch, som kan markera text på godtyckliga objekt, inklusive etiketter, informationsskyltar och vägmärken. Ett konvolutionellt återkommande neuralt nätverk används för att känna igen teckensekvenser CRNN (Convolutional Recurrent Neural Network, en kombination av DCNN och RNN) och algoritm CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) för att avkoda neurala nätverksutdata till textrepresentation.

Källa: opennet.ru

Lägg en kommentar