Eldono de GNU Ocrad 0.28 OCR-sistemo

Post tri jaroj ekde la lasta eldono, la tekstrekono Ocrad 0.28 (Optika Karaktero-Rekono), ellaborita sub la aŭspicioj de la projekto GNU, estis publikigita. Ocrad povas esti uzata kaj en la formo de biblioteko por integri OCR-funkciojn en aliajn aplikojn, kaj en la formo de aparta utileco kiu, surbaze de la bildo pasita al la enigaĵo, produktas tekston en UTF-8 aŭ 8-bitaj kodigoj.

Por optika rekono, Ocrad uzas la trajto-eltiradmetodon. Inkluzivas paĝan enpaĝigan analizilon, kiu ebligas al vi ĝuste apartigi kolumnojn kaj tekstoblokojn en presitaj dokumentoj. Rekono estas subtenata nur por signoj de la kodigoj "ascii", "iso-8859-9" kaj "iso-8859-15" (ne ekzistas subteno por la cirila alfabeto).

Oni rimarkas, ke la nova eldono inkluzivas grandan parton de etaj korektoj kaj plibonigoj. La plej signifa ŝanĝo estis subteno por la PNG-bildformato, efektivigita per la libpng-biblioteko, kiu tre simpligis laboradon kun la programo, ĉar antaŭe nur bildoj en PNM-formatoj povus esti enigeblaj.

fonto: opennet.ru

Aldoni komenton