Системаи нави шинохтани матни оптикии EasyOCR

лоиҳа EasyOCR Системаи нави шинохти матни оптикӣ таҳия шуда истодааст, ки беш аз 40 забон, аз ҷумла англисӣ, олмонӣ, фаронсавӣ, японӣ, чинӣ, кореягӣ, узбакӣ, озарбойҷонӣ ва литваиро дастгирӣ мекунад. Забонҳои кириллӣ ҳанӯз дастгирӣ намешаванд, аммо онҳо ба рӯйхати нақшаҳо илова карда мешаванд. Рамз дар Python бо истифода аз чаҳорчӯба навишта шудааст PyTorch и паҳн мекунад дар зери Apache 2.0 литсензия шудааст. Барои бор кардан таъмин карда шудааст моделҳои тайёр барои забонҳо дар асоси алифбои лотинӣ ва иероглифҳо.

Усулҳои омӯзиши мошинсозӣ барои муайян ва шинохтани матн дар тасвир истифода мешаванд. Барои муайян кардани матн алгоритми омӯзиши мошин истифода мешавад ҳунармандӣ (Огоҳӣ дар бораи аломатҳо-минтақа барои матн) дар амалй гардондани барои PyTorch, қодир аст, ки матнро дар объектҳои худсарона, аз ҷумла тамғакоғазҳо, аломатҳои иттилоотӣ ва аломатҳои роҳ таъкид кунад. Барои шинохти пайдарпайии аломатҳо як шабакаи нейронҳои такроршаванда истифода мешавад CRNN (Шабакаи нейронҳои такрории конволютсионӣ, маҷмӯи DCNN ва RNN) ва алгоритм CTC BeamSearch CTC BeamSearch (Таснифи муваққатии Connectionist) барои рамзкушоӣ кардани баромади шабакаи нейронӣ ба муаррифии матн.

Манбаъ: opennet.ru

Илова Эзоҳ