Sistim pangakuan téks optik anyar EasyOCR

proyék EasyOCR Sistem pangakuan téks optik anyar dikembangkeun anu ngadukung langkung ti 40 basa, kalebet Inggris, Jerman, Perancis, Jepang, Cina, Korea, Uzbek, Azerbaijan sareng Lituania. Basa basis Sirilik teu acan dirojong, tapi aranjeunna nuju ditambahkeun kana daptar rencana. Kodeu ditulis dina Python nganggo kerangka PyTorch и disebarkeun ku dilisensikeun dina Apache 2.0. Pikeun loading disadiakeun model siap-dijieun pikeun basa dumasar kana alfabét Latin jeung hiéroglif.

Métode pembelajaran mesin digunakeun pikeun ngaidentipikasi sareng mikawanoh téks dina gambar. Algoritma pembelajaran mesin dianggo pikeun ngaidentipikasi téks karajinan (Kasadaran Karakter-Daérah Pikeun Téks) dina palaksanaan pikeun PyTorch, sanggup nyorot téks dina objék sawenang, kaasup labél, tanda informasi jeung tanda jalan. Jaringan saraf recurrent convolutional dipaké pikeun mikawanoh runtuyan karakter CRNN (Convolutional Recurrent Neural Network, kombinasi DCNN sareng RNN) sareng algoritma CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) pikeun decode kaluaran jaringan neural kana ngagambarkeun téks.

sumber: opennet.ru

Tambahkeun komentar