Yeni optik metin tanıma sistemi EasyOCR

proje KolayOCR развивается новая система оптического распознавания текста, поддерживающая более 40 языков, включая английский, немецкий, французский, японский, китайский, корейский, узбекский, азербайджанский и литовский. Языки на основе кириллицы пока не поддерживаются, но их добавление в списке планов. Код написан на языке Python c использованием фреймворка PyTorch и tarafından dağıtıldı под лицензией Apache 2.0. Для загрузки tedarik edilen готовые модели для языков на основе латинского алфавита и иероглифов.

Для определения и распознавания текста на изображении применяются методы машинного обучения. Для определения текста используется алгоритм машинного обучения Zanaat (Character-Region Awareness For Text) в uygulama для PyTorch, способный выделять текст на произвольных объектах, включая этикетки, информационные таблички и дорожные знаки. Для распознавания последовательностей символов применяется свёрточно-рекуррентная нейронная сеть CRNN (Convolutional Recurrent Neural Network, комбинация DCNN и RNN) и алгоритм CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) для декодирования выходных данных нейронной сети в текстовое представление.

Kaynak: opennet.ru

Yorum ekle