Córas nua aitheantais téacs optúil EasyOCR

Tionscadal ÉascaOCR Tá córas nua aitheantais optúil téacs á fhorbairt a thacaíonn le níos mó ná 40 teanga, lena n-áirítear Béarla, Gearmáinis, Fraincis, Seapáinis, Sínis, Cóiréis, Úisbéicis, Asarbaiseáinis agus Liotuáinis. Ní thacaítear le teangacha Coireallacha go fóill, ach tá siad á gcur leis an liosta pleananna. Tá an cód scríofa i Python ag baint úsáide as an gcreat PyTorch и dáilte ag ceadúnaithe faoi Apache 2.0. Le haghaidh luchtú ar fáil múnlaí réamhdhéanta do theangacha atá bunaithe ar an aibítir Laidineach agus na hieroglyphs.

Úsáidtear modhanna meaisínfhoghlama chun téacs in íomhá a aithint agus a aithint. Úsáidtear algartam meaisínfhoghlama chun téacs a aithint CRAFT (Feasacht Carachtair-Réigiún Chun Téacs) i chur i bhfeidhm do PyTorch, atá in ann téacs a aibhsiú ar rudaí treallach, lena n-áirítear lipéid, comharthaí faisnéise agus comharthaí bóthair. Baintear úsáid as líonra néarach athfhillteach réititheach chun seichimh charachtair a aithint CRNN (Líonra Néarach Athfhillteach Convolutional, meascán de DCNN agus RNN) agus algartam CTC BeamSearch CTC BeamSearch (Aicmiú Sealadach Nasctha) chun aschur líonra néaraigh a dhíchódú i léiriú téacs.

Foinse: oscailtenet.ru

Add a comment