Siostam aithne teacsa optigeach ùr EasyOCR

pròiseict EasyOCR Thathas a’ leasachadh siostam aithneachaidh teacsa optigeach ùr a bheir taic do chòrr air 40 cànan, a’ gabhail a-steach Beurla, Gearmailtis, Fraingis, Seapanais, Sìonais, Coirèanais, Uzbek, Azerbaijani agus Liotuàinis. Chan eil cànanan stèidhichte ann an Cirilis fhathast a' faighinn taic, ach thathas gan cur ris an liosta phlanaichean. Tha an còd sgrìobhte ann am Python a’ cleachdadh an fhrèam PyTorch и air a sgaoileadh le le cead fo Apache 2.0. Airson luchdachadh air an toirt seachad modalan deiseil airson cànanan stèidhichte air an aibideil Laideann agus hieroglyphs.

Bithear a’ cleachdadh dhòighean ionnsachaidh inneal gus teacsa ann an ìomhaigh aithneachadh agus aithneachadh. Bithear a’ cleachdadh algairim ionnsachaidh inneal gus teacsa aithneachadh ceàird (Mothachadh Caractar-sgìre airson Teacs) ann an buileachadh airson PyTorch, comasach air teacsa a shoilleireachadh air nithean neo-riaghailteach, a’ gabhail a-steach bileagan, soidhnichean fiosrachaidh agus soidhnichean rathaid. Bithear a’ cleachdadh lìonra neural ath-chuairteach gus sreathan caractar aithneachadh CRNN (Lìonra Neural Convolutional Recurrent, measgachadh de DCNN agus RNN) agus algairim CTC BeamSearch CTC BeamSearch (Seòrsachadh Ùine Ceangal) gus toradh lìonra neural a dhì-chòdachadh gu riochdachadh teacsa.

Source: fosgailtenet.ru

Cuir beachd ann