Pagpagawas sa GNU Ocrad 0.28 OCR nga sistema

Human sa tulo ka tuig sukad sa kataposang pagpagawas, ang Ocrad 0.28 (Optical Character Recognition) nga sistema sa pag-ila sa teksto, naugmad ubos sa pagdumala sa proyekto sa GNU, gipagawas na. Ang Ocrad mahimong magamit pareho sa porma sa usa ka librarya alang sa pag-integrate sa mga function sa OCR sa ubang mga aplikasyon, ug sa porma sa usa ka bulag nga utility nga, base sa imahe nga gipasa sa input, nagpatunghag teksto sa UTF-8 o 8-bit nga mga pag-encode.

Para sa optical recognition, gigamit ni Ocrad ang feature extraction method. Naglakip sa usa ka tig-analisa sa layout sa panid nga nagtugot kanimo sa husto nga pagbulag sa mga kolum ug mga bloke sa teksto sa giimprinta nga mga dokumento. Ang pag-ila gisuportahan lamang sa mga karakter gikan sa "ascii", "iso-8859-9" ug "iso-8859-15" nga mga pag-encode (walay suporta sa Cyrillic alphabet).

Namatikdan nga ang bag-ong pagpagawas naglakip sa daghang bahin sa menor de edad nga pag-ayo ug pagpaayo. Ang labing hinungdanon nga pagbag-o mao ang suporta alang sa format sa imahe sa PNG, nga gipatuman gamit ang librarya sa libpng, nga labi nga gipasimple ang pagtrabaho kauban ang programa, tungod kay kaniadto mga imahe lamang sa mga format sa PNM ang mahimong input.

Source: opennet.ru

Idugang sa usa ka comment