Nova optika teksta rekonsistemo EasyOCR

projekto EasyOCR Nova optika tekstrekona sistemo estas disvolvita, kiu subtenas pli ol 40 lingvojn, inkluzive de la angla, germana, franca, japana, ĉina, korea, uzbeka, azera kaj litova. Cirila-bazitaj lingvoj ankoraŭ ne estas subtenataj, sed ili estas aldonitaj al la listo de planoj. La kodo estas skribita en Python uzante la kadron PyTorch и distribuita de licencita sub Apache 2.0. Por ŝarĝo estas provizitaj pretaj modeloj por lingvoj bazitaj sur la latina alfabeto kaj hieroglifoj.

Maŝinaj lernaj metodoj estas uzataj por identigi kaj rekoni tekston en bildo. Maŝinlernada algoritmo estas uzata por identigi tekston CRAFT (Character-Region Awareness For Text) en efektivigo por PyTorch, kapabla reliefigi tekston pri arbitraj objektoj, inkluzive de etikedoj, informsignoj kaj vojsignoj. Konvolucia ripetiĝanta neŭrala reto estas uzata por rekoni signajn sekvencojn CRNN (Convolutional Recurrent Neural Network, kombinaĵo de DCNN kaj RNN) kaj algoritmo CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) por malkodi neŭralan reton-produktaĵon en tekstan reprezentadon.

fonto: opennet.ru

Aldoni komenton