Új optikai szövegfelismerő rendszer, EasyOCR

projekt EasyOCR Új optikai szövegfelismerő rendszer fejlesztés alatt áll, amely több mint 40 nyelvet támogat, köztük angolt, németet, franciát, japánt, kínait, koreait, üzbég, azerbajdzsánit és litvánt. A cirill alapú nyelvek még nem támogatottak, de felkerülnek a tervek listájára. A kód Pythonban van megírva a keretrendszer segítségével PyTorch и forgalmazza licence Apache 2.0. A betöltéshez biztosítják kész modellek a latin ábécé és hieroglifák alapján készült nyelvekhez.

A gépi tanulási módszereket a kép szövegének azonosítására és felismerésére használják. A szöveg azonosítására gépi tanulási algoritmust használnak VÍZI (Karakter-régió tudatosság szöveghez) in végrehajtás PyTorch számára, amely képes tetszőleges objektumok szövegének kiemelésére, beleértve a címkéket, információs táblákat és útjelző táblákat. Egy konvolúciós visszatérő neurális hálózatot használnak a karaktersorozatok felismerésére CRNN (Convolutional Recurrent Neural Network, a DCNN és ​​RNN kombinációja) és az algoritmus CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) a neurális hálózat kimenetének szöveges megjelenítésbe való dekódolásához.

Forrás: opennet.ru

Hozzászólás