GNU Ocrad 0.28 OCR系統發布

距離上次發布三年後,在 GNU 計畫的支持下開發的 Ocrad 0.28(光學字元辨識)文字辨識系統現已發布。 Ocrad 既可以以庫的形式使用,用於將OCR 功能整合到其他應用程式中,也可以以單獨的實用程式的形式使用,該實用程式基於傳遞到輸入的圖像,產生UTF-8 或8 位元編碼的文本。

對於光學識別,Ocrad 採用特徵提取方法。 包括一個頁面佈局分析器,可讓您正確分隔列印文件中的文字列和文字區塊。 僅支援識別「ascii」、「iso-8859-9」和「iso-8859-15」編碼中的字元(不支援西里爾字母)。

值得注意的是,新版本包括很大一部分小修復和改進。 最重要的變化是對 PNG 圖像格式的支持,使用 libpng 庫實現,這大大簡化了程式的使用,因為以前只能輸入 PNM 格式的圖像。

來源: opennet.ru

添加評論