Veröffentlichung des OCR-Systems GNU Ocrad 0.28

Drei Jahre nach der letzten Veröffentlichung wurde das unter der Schirmherrschaft des GNU-Projekts entwickelte Texterkennungssystem Ocrad 0.28 (Optical Character Recognition) veröffentlicht. Ocrad kann sowohl in Form einer Bibliothek zur Integration von OCR-Funktionen in andere Anwendungen als auch in Form eines separaten Dienstprogramms verwendet werden, das basierend auf dem an die Eingabe übergebenen Bild Text in UTF-8- oder 8-Bit-Kodierung erzeugt.

Zur optischen Erkennung nutzt Ocrad die Methode der Merkmalsextraktion. Enthält einen Seitenlayout-Analysator, mit dem Sie Spalten und Textblöcke in gedruckten Dokumenten korrekt trennen können. Die Erkennung wird nur für Zeichen der Kodierungen „ascii“, „iso-8859-9“ und „iso-8859-15“ unterstützt (das kyrillische Alphabet wird nicht unterstützt).

Es wird darauf hingewiesen, dass die neue Version einen großen Teil kleinerer Korrekturen und Verbesserungen enthält. Die bedeutendste Änderung war die Unterstützung des PNG-Bildformats, implementiert mithilfe der libpng-Bibliothek, was die Arbeit mit dem Programm erheblich vereinfachte, da bisher nur Bilder im PNM-Format eingegeben werden konnten.

Source: opennet.ru

Kommentar hinzufügen