ピクセル化されたテキストを検出するツールである Unredacter を導入しました

Unredacter ツールキットが表示されます。これを使用すると、ピクセル化に基づくフィルターを使用してテキストを非表示にした後、元のテキストを復元できます。 たとえば、このプログラムを使用すると、ドキュメントのスクリーンショットやスナップショットにピクセル化された機密データやパスワードを識別できます。 Unredacter に実装されたアルゴリズムは、Depix など、以前に利用可能だった同様のユーティリティよりも優れており、Jumpsec 研究所が提案したピクセル化されたテキストを識別するテストにも合格するために使用されていると主張されています。 プログラム コードは TypeScript で記述され、GPLv3 ライセンスに基づいて配布されます。

テキストを復元するために、Unredacter は逆選択方法を使用します。これに従って、元のピクセル化された画像の一部が、異なるシフトと変更された特性でピクセル化された文字のペアを検索することによって合成されたバリアントと比較されます。 検索中に、元のフラグメントに最もよく一致するオプションが徐々に選択されます。 正常に動作するには、フォントのサイズ、タイプ、インデントのパラメータを正しく推測するだけでなく、ピクセル化グリッドのセル サイズとテキスト上のグリッド オーバーレイの位置を計算する必要があります (グリッド オフセット オプションは自動的に分類されます)。 。

ピクセル化されたテキストを検出するツールである Unredacter を導入しました

さらに、Depix ユーティリティのバージョンが準備されたフレームワーク内で、隠れマルコフ モデルに基づくアルゴリズムに変換された DepixHMM プロジェクトに注目することができます。これにより、シンボル再構築の精度を向上させることができました。

出所: オープンネット.ru

コメントを追加します