Vydání GNU Ocrad 0.28 OCR systému

Po třech letech od posledního vydání byl vydán systém rozpoznávání textu Ocrad 0.28 (Optical Character Recognition), vyvinutý pod záštitou projektu GNU. Ocrad lze použít jak ve formě knihovny pro integraci funkcí OCR do jiných aplikací, tak ve formě samostatného nástroje, který na základě obrázku předávaného na vstup vytváří text v UTF-8 nebo 8-bit kódování.

Pro optické rozpoznávání používá Ocrad metodu extrakce rysů. Obsahuje analyzátor rozvržení stránky, který umožňuje správně oddělit sloupce a bloky textu v tištěných dokumentech. Rozpoznávání je podporováno pouze pro znaky z kódování "ascii", "iso-8859-9" a "iso-8859-15" (azbuka není podporována).

Je třeba poznamenat, že nové vydání obsahuje velkou část drobných oprav a vylepšení. Nejvýznamnější změnou byla podpora obrazového formátu PNG realizovaného pomocí knihovny libpng, což značně zjednodušilo práci s programem, protože dříve bylo možné zadávat pouze obrázky ve formátech PNM.

Zdroj: opennet.ru

Přidat komentář