Sistema ġdida ta' rikonoxximent ottiku tat-test EasyOCR

Proġett EasyOCR Qed tiġi żviluppata sistema ġdida ta’ rikonoxximent tat-test ottiku li tappoġġja aktar minn 40 lingwa, inklużi l-Ingliż, il-Ġermaniż, il-Franċiż, il-Ġappuniż, iċ-Ċiniż, il-Korean, l-Użbek, l-Ażerbajġan u l-Litwan. Lingwi bbażati fuq iċ-ċirilliku għadhom mhumiex appoġġjati, iżda qed jiżdiedu mal-lista ta 'pjanijiet. Il-kodiċi huwa miktub f'Python bl-użu tal-qafas PyTorch и imqassma minn liċenzjat taħt Apache 2.0. Għat-tagħbija huma pprovduti mudelli lesti għal-lingwi bbażati fuq l-alfabett Latin u l-ġeroglifi.

Metodi ta’ tagħlim bil-magni jintużaw biex jidentifikaw u jirrikonoxxu test f’immaġini. Algoritmu tat-tagħlim tal-magni jintuża biex jidentifika t-test INĠENJI (Għarfien ta' Karattru-Reġjun Għal Test) fi implimentazzjoni għal PyTorch, kapaċi jenfasizza test fuq oġġetti arbitrarji, inklużi tikketti, sinjali ta 'informazzjoni u sinjali tat-toroq. Netwerk newrali rikorrenti konvoluzzjonali jintuża biex jirrikonoxxi sekwenzi ta 'karattri CRNN (Netwerk Neural Rikorrenti Konvoluzzjonali, taħlita ta 'DCNN u RNN) u algoritmu CTC BeamSearch CTC BeamSearch (Klassifikazzjoni Temporali ta' Connectionist) biex jiddekodifika l-output tan-netwerk newrali f'rappreżentazzjoni tat-test.

Sors: opennet.ru

Żid kumment