Nový optický systém rozpoznávania textu EasyOCR

Projekt EasyOCR Vyvíja sa nový systém optického rozpoznávania textu, ktorý podporuje viac ako 40 jazykov vrátane angličtiny, nemčiny, francúzštiny, japončiny, čínštiny, kórejčiny, uzbečtiny, azerbajdžančiny a litovčiny. Jazyky založené na azbuke zatiaľ nie sú podporované, ale pridávajú sa do zoznamu plánov. Kód je napísaný v Pythone pomocou frameworku PyTorch и distribuovaný licencovaný pod Apache 2.0. Na nakladanie poskytnuté hotové modely pre jazyky založené na latinskej abecede a hieroglyfoch.

Na identifikáciu a rozpoznanie textu na obrázku sa používajú metódy strojového učenia. Na identifikáciu textu sa používa algoritmus strojového učenia CRAFT (Povedomie o znakoch a regiónoch pre text) v implementáciu pre PyTorch, schopný zvýrazniť text na ľubovoľných objektoch, vrátane štítkov, informačných značiek a dopravných značiek. Na rozpoznávanie sekvencií znakov sa používa konvolučná rekurentná neurónová sieť CRNN (Konvolučná rekurentná neurónová sieť, kombinácia DCNN a RNN) a algoritmus CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) na dekódovanie výstupu neurónovej siete do textovej reprezentácie.

Zdroj: opennet.ru

Pridať komentár