Vrystelling van GNU Ocrad 0.28 OCR-stelsel

Na drie jaar sedert die laaste vrystelling, is die Ocrad 0.28 (Optical Character Recognition) teksherkenningstelsel, ontwikkel onder die vaandel van die GNU-projek, vrygestel. Ocrad kan beide in die vorm van 'n biblioteek gebruik word om OCR-funksies in ander toepassings te integreer, en in die vorm van 'n aparte hulpprogram wat, gebaseer op die beeld wat na die invoer gestuur word, teks in UTF-8 of 8-bis enkoderings produseer.

Vir optiese herkenning gebruik Ocrad die kenmerk-ekstraksiemetode. Sluit 'n bladsyuitleg-ontleder in wat jou toelaat om kolomme en teksblokke in gedrukte dokumente korrek te skei. Herkenning word slegs ondersteun vir karakters van die "ascii", "iso-8859-9" en "iso-8859-15" enkoderings (daar is geen ondersteuning vir die Cyrilliese alfabet nie).

Daar word kennis geneem dat die nuwe weergawe 'n groot gedeelte van geringe regstellings en verbeterings insluit. Die belangrikste verandering was ondersteuning vir die PNG-beeldformaat, geïmplementeer met behulp van die libpng-biblioteek, wat die werk met die program aansienlik vereenvoudig het, aangesien voorheen slegs beelde in PNM-formate ingevoer kon word.

Bron: opennet.ru

Voeg 'n opmerking