Տեքստի ճանաչման նոր օպտիկական համակարգ EasyOCR

Նախագիծ EasyOCR Մշակվում է տեքստի ճանաչման օպտիկական նոր համակարգ, որն աջակցում է ավելի քան 40 լեզուների, այդ թվում՝ անգլերեն, գերմաներեն, ֆրանսերեն, ճապոներեն, չինարեն, կորեերեն, ուզբեկերեն, ադրբեջաներեն և լիտվերեն: Կիրիլյան վրա հիմնված լեզուները դեռ չեն աջակցվում, բայց դրանք ավելացվում են պլանների ցանկում: Կոդը գրված է Python-ում՝ օգտագործելով շրջանակը PyTorch- ը и տարածվում է լիցենզավորված Apache 2.0-ի համաձայն: Բեռնման համար տրամադրվում է պատրաստի մոդելներ լեզուների համար՝ հիմնված լատինական այբուբենի և հիերոգլիֆների վրա։

Մեքենայական ուսուցման մեթոդներն օգտագործվում են պատկերի մեջ տեքստը բացահայտելու և ճանաչելու համար: Տեքստը նույնականացնելու համար օգտագործվում է մեքենայական ուսուցման ալգորիթմ Արհեստ (Character-Region Awareness For Text) in իրականացումը PyTorch-ի համար, որը կարող է ընդգծել տեքստը կամայական օբյեկտների վրա, ներառյալ պիտակները, տեղեկատվական նշանները և ճանապարհային նշանները: Նիշերի հաջորդականությունը ճանաչելու համար օգտագործվում է կոնվոլյուցիոն կրկնվող նեյրոնային ցանց CRNN (Convolutional Recurrent Neural Network, DCNN-ի և RNN-ի համադրություն) և ալգորիթմ CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification)՝ նեյրոնային ցանցի ելքը վերծանելու տեքստի ներկայացման մեջ:

Source: opennet.ru

Добавить комментарий