Sistem pengenalan teks optik baru EasyOCR

Proyek OCR Mudah Sistem pengenalan teks optik baru sedang dikembangkan yang mendukung lebih dari 40 bahasa, termasuk Inggris, Jerman, Prancis, Jepang, Cina, Korea, Uzbekistan, Azerbaijan, dan Lituania. Bahasa berbasis Sirilik belum didukung, namun ditambahkan ke daftar paket. Kode ini ditulis dengan Python menggunakan kerangka kerja PyTorch и didistribusikan oleh berlisensi di bawah Apache 2.0. Untuk memuat disediakan model siap pakai untuk bahasa berdasarkan alfabet Latin dan hieroglif.

Metode pembelajaran mesin digunakan untuk mengidentifikasi dan mengenali teks dalam gambar. Algoritme pembelajaran mesin digunakan untuk mengidentifikasi teks Kerajinan (Kesadaran Wilayah Karakter Untuk Teks) di penerapan untuk PyTorch, mampu menyorot teks pada objek sewenang-wenang, termasuk label, rambu informasi, dan rambu jalan. Jaringan saraf berulang konvolusional digunakan untuk mengenali urutan karakter CRNN (Convolutional Recurrent Neural Network, kombinasi DCNN dan RNN) dan algoritma Pencarian Sinar CTC CTC BeamSearch (Connectionist Temporal Classification) untuk memecahkan kode keluaran jaringan saraf menjadi representasi teks.

Sumber: opennet.ru

Tambah komentar