EasyOCR yangi optik matnni aniqlash tizimi

Loyiha EasyOCR Ingliz, nemis, fransuz, yapon, xitoy, koreys, o‘zbek, ozarbayjon va litva kabi 40 dan ortiq tillarni qo‘llab-quvvatlaydigan yangi optik matnni aniqlash tizimi ishlab chiqilmoqda. Kirillchaga asoslangan tillar hali qo'llab-quvvatlanmaydi, ammo ular rejalar ro'yxatiga qo'shilmoqda. Kod Python-da ramka yordamida yozilgan PyTorch и tarqaladi Apache 2.0 ostida litsenziyalangan. Yuklash uchun taqdim etilgan lotin alifbosi va ierogliflarga asoslangan tillar uchun tayyor modellar.

Mashinani o'rganish usullari tasvirdagi matnni aniqlash va tanib olish uchun ishlatiladi. Matnni aniqlash uchun mashinani o'rganish algoritmi qo'llaniladi CRAFT (Matn uchun belgi-mintaqa xabardorligi) ichida amalga oshirish PyTorch uchun, ixtiyoriy ob'ektlardagi matnni, jumladan teglar, ma'lumot belgilari va yo'l belgilarini ajratib ko'rsatishga qodir. Belgilar ketma-ketligini tanib olish uchun konvolyutsion takrorlanuvchi neyron tarmog'idan foydalaniladi CRNN (Convolutional Recurrent Neural Network, DCNN va RNN kombinatsiyasi) va algoritm CTC BeamSearch Neyron tarmoq chiqishini matn ko'rinishida dekodlash uchun CTC BeamSearch (Connectionist Temporal Classification).

Manba: opennet.ru

a Izoh qo'shish