GNU Ocrad 0.28 OCR系统发布

距上次发布三年后,在 GNU 项目的支持下开发的 Ocrad 0.28(光学字符识别)文本识别系统现已发布。 Ocrad 既可以以库的形式使用,用于将 OCR 功能集成到其他应用程序中,也可以以单独的实用程序的形式使用,该实用程序基于传递到输入的图像,生成 UTF-8 或 8 位编码的文本。

对于光学识别,Ocrad 采用特征提取方法。 包括一个页面布局分析器,可让您正确分隔打印文档中的文本列和文本块。 仅支持识别“ascii”、“iso-8859-9”和“iso-8859-15”编码中的字符(不支持西里尔字母)。

值得注意的是,新版本包括很大一部分小修复和改进。 最重要的变化是对 PNG 图像格式的支持,使用 libpng 库实现,这大大简化了程序的使用,因为以前只能输入 PNM 格式的图像。

来源: opennet.ru

添加评论