Vydanie GNU Ocrad 0.28 OCR systému

Po troch rokoch od posledného vydania bol vydaný systém rozpoznávania textu Ocrad 0.28 (Optical Character Recognition), vyvinutý pod záštitou projektu GNU. Ocrad je možné použiť ako vo forme knižnice na integráciu OCR funkcií do iných aplikácií, tak aj vo forme samostatnej utility, ktorá na základe obrazu odovzdaného na vstup produkuje text v UTF-8 alebo 8-bitovom kódovaní.

Na optické rozpoznávanie Ocrad používa metódu extrakcie prvkov. Obsahuje analyzátor rozloženia strany, ktorý vám umožní správne oddeliť stĺpce a bloky textu v tlačených dokumentoch. Rozpoznávanie je podporované iba pre znaky z kódovania "ascii", "iso-8859-9" a "iso-8859-15" (nie je podporovaná azbuka).

Je potrebné poznamenať, že nové vydanie obsahuje veľkú časť menších opráv a vylepšení. Najvýznamnejšou zmenou bola podpora obrazového formátu PNG, implementovaná pomocou knižnice libpng, čo značne zjednodušilo prácu s programom, keďže predtým bolo možné zadávať iba obrázky vo formátoch PNM.

Zdroj: opennet.ru

Pridať komentár