Uus optiline tekstituvastussüsteem EasyOCR

projekt EasyOCR Arendatakse uut optilist tekstituvastussüsteemi, mis toetab enam kui 40 keelt, sealhulgas inglise, saksa, prantsuse, jaapani, hiina, korea, usbeki, aserbaidžaani ja leedu keelt. Kirillitsapõhiseid keeli veel ei toetata, kuid need lisatakse plaanide loendisse. Kood on kirjutatud Pythonis, kasutades raamistikku PyTorch и jaotatud litsentsitud Apache 2.0 alusel. Laadimiseks on ette nähtud Ladina tähestikul ja hieroglüüfidel põhinevate keelte valmismudelid.

Pildil oleva teksti tuvastamiseks ja äratundmiseks kasutatakse masinõppe meetodeid. Teksti tuvastamiseks kasutatakse masinõppe algoritmi CRAFT (Tähemärk-Region Awareness For Text) sisse rakendamine PyTorchi jaoks, mis suudab esile tõsta teksti suvalistel objektidel, sealhulgas siltidel, teabesildidel ja liiklusmärkidel. Märgijadade äratundmiseks kasutatakse konvolutsioonilist korduvat närvivõrku CRNN (Convolutional Recurrent Neural Network, DCNN ja RNN kombinatsioon) ja algoritm CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) närvivõrgu väljundi dekodeerimiseks tekstiks.

Allikas: opennet.ru

Lisa kommentaar