ប្រព័ន្ធសម្គាល់អត្ថបទអុបទិកថ្មី EasyOCR

គម្រោង EasyOCR развивается новая система оптического распознавания текста, поддерживающая более 40 языков, включая английский, немецкий, французский, японский, китайский, корейский, узбекский, азербайджанский и литовский. Языки на основе кириллицы пока не поддерживаются, но их добавление в списке планов. Код написан на языке Python c использованием фреймворка ភីធ័រ и ចែកចាយ​ដោយ под лицензией Apache 2.0. Для загрузки ត្រូវបានផ្តល់ជូន готовые модели для языков на основе латинского алфавита и иероглифов.

Для определения и распознавания текста на изображении применяются методы машинного обучения. Для определения текста используется алгоритм машинного обучения សិប្បកម្ម (Character-Region Awareness For Text) в ការអនុវត្ត для PyTorch, способный выделять текст на произвольных объектах, включая этикетки, информационные таблички и дорожные знаки. Для распознавания последовательностей символов применяется свёрточно-рекуррентная нейронная сеть CRNN (Convolutional Recurrent Neural Network, комбинация DCNN и RNN) и алгоритм CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) для декодирования выходных данных нейронной сети в текстовое представление.

ប្រភព: opennet.ru

បន្ថែមមតិយោបល់