Lage sistèm GNU Ocrad 0.28 OCR

Apre twazan depi dènye lage a, sistèm rekonesans tèks Ocrad 0.28 (Optical Character Recognition), devlope anba ejid pwojè GNU a, te lage. Ocrad ka itilize tou de nan fòm lan nan yon bibliyotèk pou entegre fonksyon OCR nan lòt aplikasyon, ak nan fòm lan nan yon sèvis piblik separe ki, ki baze sou imaj la pase nan opinyon an, pwodui tèks nan UTF-8 oswa kodaj 8-bit.

Pou rekonesans optik, Ocrad itilize metòd ekstraksyon karakteristik. Gen ladann yon analizeur layout paj ki pèmèt ou kòrèkteman separe kolòn ak blòk tèks nan dokiman enprime. Rekonesans sipòte sèlman pou karaktè ki soti nan kodaj "ascii", "iso-8859-9" ak "iso-8859-15" (pa gen okenn sipò pou alfabè sirilik la).

Li te note ke nouvo lage a gen ladan yon gwo pati nan koreksyon minè ak amelyorasyon. Chanjman ki pi enpòtan an se sipò pou fòma imaj PNG a, ki te aplike lè l sèvi avèk libpng bibliyotèk la, ki te senplifye travay ak pwogram nan anpil, paske anvan sèlman imaj nan fòma PNM te kapab antre.

Sous: opennet.ru

Add nouvo kòmantè