System adnabod testun optegol newydd EasyOCR

prosiect HawddOCR Mae system adnabod testun optegol newydd yn cael ei datblygu sy'n cefnogi mwy na 40 o ieithoedd, gan gynnwys Saesneg, Almaeneg, Ffrangeg, Japaneaidd, Tsieinëeg, Corëeg, Wsbeceg, Azerbaijani a Lithwaneg. Nid yw ieithoedd sy'n seiliedig ar Syrilig yn cael eu cefnogi eto, ond maent yn cael eu hychwanegu at y rhestr o gynlluniau. Mae'r cod wedi'i ysgrifennu yn Python gan ddefnyddio'r fframwaith PyTorch и dosbarthu gan wedi'i drwyddedu o dan Apache 2.0. Ar gyfer llwytho yn cael eu darparu modelau parod ar gyfer ieithoedd yn seiliedig ar yr wyddor Ladin a hieroglyffau.

Defnyddir dulliau dysgu peirianyddol i adnabod ac adnabod testun mewn delwedd. Defnyddir algorithm dysgu peirianyddol i adnabod testun CRAFT (Ymwybyddiaeth Cymeriad-Rhanbarth Ar Gyfer Testun) in gweithredu ar gyfer PyTorch, sy'n gallu amlygu testun ar wrthrychau mympwyol, gan gynnwys labeli, arwyddion gwybodaeth ac arwyddion ffyrdd. Defnyddir rhwydwaith niwral cylchol troellog i adnabod dilyniannau nodau CRNN (Convolutional Recurrent Neural Network, cyfuniad o DCNN ac RNN) ac algorithm CTC BeamSearch CTC BeamSearch (Dosbarthiad Amserol Cysylltiad) i ddadgodio allbwn rhwydwaith niwral yn gynrychiolaeth testun.

Ffynhonnell: opennet.ru

Ychwanegu sylw