Sistem pengecaman teks optik baharu EasyOCR

projek EasyOCR Sistem pengecaman teks optik baharu sedang dibangunkan yang menyokong lebih daripada 40 bahasa, termasuk bahasa Inggeris, Jerman, Perancis, Jepun, Cina, Korea, Uzbekistan, Azerbaijan dan Lithuania. Bahasa berasaskan Cyrillic belum lagi disokong, tetapi ia sedang ditambah ke senarai rancangan. Kod ini ditulis dalam Python menggunakan rangka kerja PyTorch ΠΈ diedarkan oleh berlesen di bawah Apache 2.0. Untuk memuatkan disediakan model siap pakai untuk bahasa berdasarkan abjad Latin dan hieroglif.

Kaedah pembelajaran mesin digunakan untuk mengenal pasti dan mengecam teks dalam imej. Algoritma pembelajaran mesin digunakan untuk mengenal pasti teks Kraf (Kesedaran Watak-Wilayah Untuk Teks) dalam pelaksanaan untuk PyTorch, mampu menyerlahkan teks pada objek sewenang-wenangnya, termasuk label, tanda maklumat dan tanda jalan. Rangkaian saraf berulang konvolusi digunakan untuk mengenali jujukan aksara CRNN (Convolutional Recurrent Neural Network, gabungan DCNN dan RNN) dan algoritma CTC BeamSearch CTC BeamSearch (Klasifikasi Temporal Connectionist) untuk menyahkod output rangkaian saraf ke dalam perwakilan teks.

Sumber: opennet.ru

Tambah komen