Bag-ong optical text recognition system EasyOCR

proyekto EasyOCR Usa ka bag-ong optical text recognition system ang gihimo nga nagsuporta sa labaw sa 40 ka mga pinulongan, lakip ang English, German, French, Japanese, Chinese, Korean, Uzbek, Azerbaijani ug Lithuanian. Ang mga pinulongan nga nakabase sa Cyrillic wala pa gisuportahan, apan gidugang kini sa lista sa mga plano. Ang code gisulat sa Python gamit ang framework PyTorch ΠΈ giapod-apod sa lisensyado ubos sa Apache 2.0. Para sa loading gihatag andam nga mga modelo alang sa mga pinulongan base sa Latin nga alpabeto ug hieroglyphs.

Ang mga pamaagi sa pagkat-on sa makina gigamit sa pag-ila ug pag-ila sa teksto sa usa ka imahe. Ang usa ka algorithm sa pagkat-on sa makina gigamit sa pag-ila sa teksto BAHIN (Kahibalo-Rehiyon sa Kinaiya Alang sa Teksto) sa pagpatuman alang sa PyTorch, makahimo sa pag-highlight sa teksto sa arbitraryong mga butang, lakip ang mga label, impormasyon nga mga timailhan ug mga karatula sa dalan. Ang usa ka convolutional recurrent neural network gigamit sa pag-ila sa mga han-ay sa karakter CRNN (Convolutional Recurrent Neural Network, kombinasyon sa DCNN ug RNN) ug algorithm CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) aron ma-decode ang output sa neural network ngadto sa representasyon sa teksto.

Source: opennet.ru

Idugang sa usa ka comment