Bagong optical text recognition system EasyOCR

proyekto EasyOCR Ang isang bagong optical text recognition system ay binuo na sumusuporta sa higit sa 40 mga wika, kabilang ang English, German, French, Japanese, Chinese, Korean, Uzbek, Azerbaijani at Lithuanian. Ang mga wikang batay sa Cyrillic ay hindi pa sinusuportahan, ngunit idinaragdag ang mga ito sa listahan ng mga plano. Ang code ay nakasulat sa Python gamit ang framework PyTorch ΠΈ ipinamahagi ni lisensyado sa ilalim ng Apache 2.0. Para sa paglo-load ay ibinigay yari na mga modelo para sa mga wika batay sa alpabetong Latin at hieroglyph.

Ginagamit ang mga pamamaraan ng machine learning para matukoy at makilala ang text sa isang larawan. Ginagamit ang machine learning algorithm para matukoy ang text CRAFT (Character-Region Awareness Para sa Teksto) sa pagpapatupad para sa PyTorch, na may kakayahang mag-highlight ng teksto sa mga arbitrary na bagay, kabilang ang mga label, mga palatandaan ng impormasyon at mga palatandaan sa kalsada. Ang isang convolutional recurrent neural network ay ginagamit upang makilala ang mga pagkakasunud-sunod ng character CRNN (Convolutional Recurrent Neural Network, isang kumbinasyon ng DCNN at RNN) at algorithm CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) upang i-decode ang output ng neural network sa representasyon ng teksto.

Pinagmulan: opennet.ru

Magdagdag ng komento