推出 Unredacter,一種用於檢測像素化文本的工具

提供了 Unredacter 工具包,它允許您在使用基於像素化的過濾器隱藏文字後恢復原始文字。 例如,該程式可用於識別螢幕截圖或文件快照中像素化的敏感資料和密碼。 據稱,Unredacter 中實現的演算法優於先前可用的類似實用程式(例如 Depix),並且還成功用於通過了 Jumpsec 實驗室提出的識別像素化文字的測試。 程式碼是用 TypeScript 編寫的,並根據 GPLv3 許可證分發。

為了恢復文本,Unredacter 使用反向選擇方法,將原始像素化圖像的一部分與透過搜尋具有不同移位和變化特徵的像素化字元對合成的變體進行比較。 在搜尋過程中,逐漸選擇與原始片段最匹配的選項。 要成功工作,您需要正確猜測字體的大小、類型和縮排參數,併計算像素化網格中的單元格大小以及網格覆蓋在文本上的位置(網格偏移選項會自動排序) 。

推出 Unredacter,一種用於檢測像素化文本的工具

此外,我們可以注意到 DepixHMM 項目,在該項目的框架內準備了 Depix 實用程式的一個版本,該版本被轉換為基於隱馬可夫模型的演算法,因此可以提高符號重建的準確性。

來源: opennet.ru

添加評論