Објавување на GNU Ocrad 0.28 OCR системот

По три години од последното издание, објавен е системот за препознавање текст Ocrad 0.28 (Оптичко препознавање знаци), развиен под покровителство на проектот ГНУ. Ocrad може да се користи и во форма на библиотека за интегрирање на функциите на OCR во други апликации, и во форма на посебна алатка која, врз основа на сликата предадена на влезот, произведува текст во UTF-8 или 8-битни шифрирања.

За оптичко препознавање, Ocrad го користи методот на екстракција на карактеристики. Вклучува анализатор на распоред на страници што ви овозможува правилно да ги одделите колоните и блоковите од текст во печатените документи. Препознавањето е поддржано само за знаци од шифрите „ascii“, „iso-8859-9“ и „iso-8859-15“ (нема поддршка за кирилицата).

Забележано е дека новото издание вклучува голем дел од мали поправки и подобрувања. Најзначајната промена беше поддршката за форматот на слика PNG, имплементиран со помош на библиотеката libpng, што значително ја поедностави работата со програмата, бидејќи претходно можеа да се внесуваат само слики во формати PNM.

Извор: opennet.ru

Додадете коментар