Нови оптички систем за препознавање текста ЕасиОЦР

Пројекат ЕасиОЦР У току је развој новог оптичког система за препознавање текста који подржава више од 40 језика, укључујући енглески, немачки, француски, јапански, кинески, корејски, узбечки, азербејџански и литвански. Језици засновани на ћирилици још увек нису подржани, али се додају на листу планова. Код је написан у Питхон-у користећи оквир ПиТорцх и дистрибуира лиценциран под Апацхе 2.0. За утовар обезбеђено готови модели за језике засноване на латиничном писму и хијероглифима.

Методе машинског учења се користе за идентификацију и препознавање текста на слици. Алгоритам машинског учења се користи за идентификацију текста Црафт (Свесност карактера и региона за текст) ин имплементација за ПиТорцх, способан да истакне текст на произвољним објектима, укључујући налепнице, информативне знакове и путне знакове. Конволуциона рекурентна неуронска мрежа се користи за препознавање секвенци карактера ЦРНН (Цонволутионал Рецуррент Неурал Нетворк, комбинација ДЦНН и РНН) и алгоритам ЦТЦ БеамСеарцх ЦТЦ БеамСеарцх (Цоннецтионист Темпорал Цлассифицатион) за декодирање излаза неуронске мреже у текстуални приказ.

Извор: опеннет.ру

Додај коментар