Nový systém optického rozpoznávání textu EasyOCR

projekt EasyOCR Vyvíjí se nový systém optického rozpoznávání textu, který podporuje více než 40 jazyků, včetně angličtiny, němčiny, francouzštiny, japonštiny, čínštiny, korejštiny, uzbečtiny, ázerbájdžánu a litevštiny. Jazyky založené na azbuce zatím nejsou podporovány, ale přidávají se do seznamu plánů. Kód je napsán v Pythonu pomocí frameworku PyTorch и distribuovány licencováno pod Apache 2.0. Pro načítání jsou poskytovány hotové modely pro jazyky založené na latinské abecedě a hieroglyfech.

K identifikaci a rozpoznání textu v obrázku se používají metody strojového učení. K identifikaci textu se používá algoritmus strojového učení ŘEMESLO (Charakter-Region Awareness for Text) in implementace pro PyTorch, schopný zvýrazňovat text na libovolných objektech, včetně štítků, informačních značek a dopravních značek. K rozpoznání sekvencí znaků se používá konvoluční rekurentní neuronová síť CRNN (Konvoluční rekurentní neuronová síť, kombinace DCNN a RNN) a algoritmus CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) pro dekódování výstupu neuronové sítě do textové reprezentace.

Zdroj: opennet.ru

Přidat komentář