Verëffentlechung vum GNU Ocrad 0.28 OCR System

No dräi Joer zënter der leschter Verëffentlechung, ass den Ocrad 0.28 (Optical Character Recognition) Texterkennungssystem, entwéckelt ënner der Regie vum GNU-Projet, verëffentlecht ginn. Ocrad ka souwuel a Form vun enger Bibliothéik benotzt ginn fir OCR Funktiounen an aner Uwendungen z'integréieren, an a Form vun engem separaten Utility deen, baséiert op dem Bild, deen un den Input passéiert ass, Text an UTF-8 oder 8-Bit Kodéierungen produzéiert.

Fir optesch Unerkennung benotzt Ocrad d'Feature Extraktiounsmethod. Ëmfaasst e Säitlayoutanalysator deen Iech erlaabt Spalten a Textblocken an gedréckten Dokumenter korrekt ze trennen. Unerkennung gëtt nëmme fir Zeeche vun den "ascii", "iso-8859-9" an "iso-8859-15" Kodéierungen ënnerstëtzt (et gëtt keng Ënnerstëtzung fir de kyrillesche Alphabet).

Et gëtt bemierkt datt déi nei Verëffentlechung e groussen Deel vu klenge Fixer a Verbesserungen enthält. Déi bedeitendst Ännerung war d'Ënnerstëtzung fir de PNG Bildformat, implementéiert mat der libpng Bibliothéik, wat d'Aarbecht mam Programm staark vereinfacht huet, well virdru nëmmen Biller an PNM Formater aginn konnten.

Source: opennet.ru

Setzt e Commentaire