推出 Unredacter,一种用于检测像素化文本的工具

提供了 Unredacter 工具包,它允许您在使用基于像素化的过滤器隐藏文本后恢复原始文本。 例如,该程序可用于识别屏幕截图或文档快照中像素化的敏感数据和密码。 据称,Unredacter 中实现的算法优于以前可用的类似实用程序(例如 Depix),并且还成功用于通过了 Jumpsec 实验室提出的识别像素化文本的测试。 程序代码是用 TypeScript 编写的,并根据 GPLv3 许可证分发。

为了恢复文本,Unredacter 使用反向选择方法,将原始像素化图像的一部分与通过搜索具有不同移位和变化特征的像素化字符对合成的变体进行比较。 在搜索过程中,逐渐选择与原始片段最匹配的选项。 要成功工作,您需要正确猜测字体的大小、类型和缩进参数,并计算像素化网格中的单元格大小以及网格覆盖在文本上的位置(网格偏移选项会自动排序) 。

推出 Unredacter,一种用于检测像素化文本的工具

此外,我们可以注意到 DepixHMM 项目,在该项目的框架内准备了 Depix 实用程序的一个版本,该版本被转换为基于隐马尔可夫模型的算法,因此可以提高符号重建的准确性。

来源: opennet.ru

添加评论