Новая сістэма аптычнага распазнання тэксту EasyOCR

Праектам EasyOCR развіваецца новая сістэма аптычнага распазнання тэксту, якая падтрымлівае больш за 40 моў, уключаючы англійскую, нямецкую, французскую, японскую, кітайскую, карэйскую, узбекскую, азербайджанскую і літоўскую. Мовы на аснове кірыліцы пакуль не падтрымліваюцца, але іх даданне ў спісе планаў. Код напісаны на мове Python з выкарыстаннем фрэймворка PyTorch и распаўсюджваецца пад ліцэнзіяй Apache 2.0. Для загрузкі прадастаўляюцца гатовыя мадэлі для моў на аснове лацінскага алфавіту і іерогліфаў.

Для вызначэння і распазнання тэксту на малюнку прымяняюцца метады машыннага навучання. Для вызначэння тэксту выкарыстоўваецца алгарытм машыннага навучання CRAFT (Character-Region Awareness For Text) у рэалізацыі для PyTorch, здольны вылучаць тэкст на адвольных аб'ектах, у тым ліку этыкеткі, інфармацыйныя таблічкі і дарожныя знакі. Для распазнання паслядоўнасцяў знакаў ужываецца скруткава-рэкурэнтная нейронавая сетка CRNN (Convolutional Recurrent Neural Network, камбінацыя DCNN і RNN) і алгарытм CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) для дэкадавання выходных дадзеных нейронавай сеткі ў тэкставае прадстаўленне.

Крыніца: opennet.ru

Дадаць каментар