Sistem pangenalan teks optik anyar EasyOCR

Proyek EasyOCR Sistem pangenalan teks optik anyar lagi dikembangake sing ndhukung luwih saka 40 basa, kalebu Inggris, Jerman, Prancis, Jepang, Cina, Korea, Uzbek, Azerbaijan lan Lithuania. Basa basis Sirilik durung didhukung, nanging ditambahake menyang dhaptar rencana. Kode ditulis ing Python nggunakake framework PyTorch ΠΈ disebarake dening dilisensi ing Apache 2.0. Kanggo loading diwenehake model siap-digawe kanggo basa adhedhasar aksara Latin lan hieroglif.

Cara machine learning digunakake kanggo ngenali lan ngenali teks ing gambar. Algoritma machine learning digunakake kanggo ngenali teks Kerajinan (Karakter-Wilayah Kesadaran Kanggo Teks) ing implementasine kanggo PyTorch, bisa nyorot teks ing obyek kasepakatan, kalebu label, pratandha informasi lan pratandha dalan. Jaringan saraf ambalan convolutional digunakake kanggo ngenali urutan karakter CRNN (Convolutional Recurrent Neural Network, kombinasi DCNN lan RNN) lan algoritma CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) kanggo decode output jaringan syaraf menyang representasi teks.

Source: opennet.ru

Add a comment