Testu optikoen hautemateko sistema berria EasyOCR

proiektua EasyOCR Testuak ezagutzeko sistema optiko berri bat garatzen ari da, 40 hizkuntza baino gehiago onartzen dituena, ingelesa, alemana, frantsesa, japoniera, txinera, koreera, uzbekera, azerbaijanera eta lituaniera barne. Zirilikoan oinarritutako hizkuntzak oraindik ez dira onartzen, baina planen zerrendara gehitzen ari dira. Kodea Python-en idazten da markoa erabiliz PyTorch ΠΈ arabera banatuta Apache 2.0 lizentziapean. Kargatzeko ematen dira latindar alfabetoan eta hieroglifoetan oinarritutako hizkuntzetarako prest dauden ereduak.

Makina ikasteko metodoak erabiltzen dira irudi bateko testua identifikatzeko eta ezagutzeko. Ikaskuntza automatikoko algoritmo bat erabiltzen da testua identifikatzeko ESKULANGINTZA (Caracter-Region Awareness For Text) urtean ezarpena PyTorch-entzat, objektu arbitrarioen testua nabarmentzeko gai dena, etiketak, informazio seinaleak eta bide seinaleak barne. Sare neuronal errekurrente konboluzionala erabiltzen da karaktere-sekuentziak ezagutzeko CRNN (Convolutional Recurrent Neural Network, DCNN eta RNN konbinazio bat) eta algoritmoa CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) sare neuronalaren irteera testu irudikapenean deskodetzeko.

Iturria: opennet.ru

Gehitu iruzkin berria