Нова система оптичного розпізнавання тексту EasyOCR

Проектом EasyOCR розвивається нова система оптичного розпізнавання тексту, що підтримує понад 40 мов, включаючи англійську, німецьку, французьку, японську, китайську, корейську, узбецьку, азербайджанську та литовську. Мови на основі кирилиці поки не підтримуються, але їхнє додавання у списку планів. Код написаний мовою Python з використанням фреймворку PyTorch и поширюється під ліцензією Apache 2.0 Для завантаження надаються готові моделі для мов на основі латинського алфавіту та ієрогліфів.

Для визначення та розпізнавання тексту на зображенні застосовуються методи машинного навчання. Для визначення тексту використовується алгоритм машинного навчання CRAFT (Character-Region Awareness For Text) реалізації для PyTorch, здатний виділяти текст на довільних об'єктах, включаючи етикетки, таблички та дорожні знаки. Для розпізнавання послідовностей символів застосовується згортково-рекурентна нейронна мережа CRNN (Convolutional Recurrent Neural Network, комбінація DCNN та RNN) та алгоритм CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) для декодування вихідних даних нейронної мережі текстове представлення.

Джерело: opennet.ru

Додати коментар або відгук