Yeni optik mətn tanıma sistemi EasyOCR

layihə EasyOCR İngilis, alman, fransız, yapon, çin, koreya, özbək, Azərbaycan və litva da daxil olmaqla 40-dan çox dili dəstəkləyən yeni optik mətn tanınma sistemi hazırlanır. Kiril əsaslı dillər hələ dəstəklənmir, lakin onlar planlar siyahısına əlavə edilir. Kod çərçivədən istifadə edərək Python-da yazılmışdır PyTorch и yayılır Apache 2.0 altında lisenziyalıdır. Yükləmək üçün təmin edilmişdir latın əlifbası və heroqliflərə əsaslanan dillər üçün hazır modellər.

Şəkildəki mətni müəyyən etmək və tanımaq üçün maşın öyrənmə üsullarından istifadə olunur. Mətni müəyyən etmək üçün maşın öyrənməsi alqoritmi istifadə olunur CRAFT (Mətn üçün Xarakter-Region Awareness) in həyata keçirilməsi etiketlər, məlumat nişanları və yol nişanları da daxil olmaqla ixtiyari obyektlərdə mətni vurğulamaq qabiliyyətinə malik olan PyTorch üçün. Simvol ardıcıllığını tanımaq üçün konvolusion təkrarlanan neyron şəbəkəsindən istifadə olunur CRNN (Convolutional Recurrent Neural Network, DCNN və RNN birləşməsi) və alqoritm CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) neyron şəbəkə çıxışını mətn təsvirinə deşifrə etmək üçün.

Mənbə: opennet.ru

Добавить комментарий