Mfumo mpya wa utambuzi wa maandishi ya macho EasyOCR

Mradi EasyOCR Mfumo mpya wa utambuzi wa maandishi ya macho unatengenezwa ambao unaweza kutumia zaidi ya lugha 40, zikiwemo Kiingereza, Kijerumani, Kifaransa, Kijapani, Kichina, Kikorea, Kiuzbeki, Kiazabajani na Kilithuania. Lugha zinazotegemea Cyrillic bado hazitumiki, lakini zinaongezwa kwenye orodha ya mipango. Nambari imeandikwa kwa Python kwa kutumia mfumo PyTorch ΠΈ kusambazwa na leseni chini ya Apache 2.0. Kwa upakiaji hutolewa mifano iliyotengenezwa tayari kwa lugha kulingana na alfabeti ya Kilatini na hieroglyphs.

Mbinu za kujifunza mashine hutumiwa kutambua na kutambua maandishi katika picha. Algorithm ya kujifunza kwa mashine hutumiwa kutambua maandishi UFUNZO (Uhamasishaji wa Tabia-Eneo Kwa Maandishi) katika utekelezaji kwa PyTorch, yenye uwezo wa kuangazia maandishi kwenye vitu vya kiholela, ikiwa ni pamoja na lebo, alama za taarifa na alama za barabarani. Mtandao wa neva unaojirudia hutumika kutambua mfuatano wa wahusika CRNN (Convolutional Recurrent Neural Network, mchanganyiko wa DCNN na RNN) na algoriti CTC BeamSearch CTC BeamSearch (Uainishaji wa Muda wa Muunganisho) ili kusimbua towe la mtandao wa neural kuwa uwakilishi wa maandishi.

Chanzo: opennet.ru

Kuongeza maoni