画面上のアーティファクトの認識

画面上のアーティファクトの認識
情報技術の発展レベルが絶え間なく向上しているため、電子文書は年々利便性が高まり、使用需要が高まっており、従来の紙媒体を圧倒し始めています。 したがって、従来の紙媒体だけでなく、電子文書の情報内容の保護にもタイムリーに注意を払うことが非常に重要です。 商業機密、国家機密、その他の機密を保有するすべての大企業は、情報漏洩や機密情報の侵害の可能性を防ぎ、漏洩が検出された場合には漏洩を阻止し、違反者を特定するための措置を講じたいと考えています。

保護オプションについて少し

これらのタスクを実行するために、特定の保護要素が導入されています。 このような要素には、バーコード、可視タグ、電子タグなどがありますが、最も興味深いのは隠しタグです。 最も印象的な代表的なものの XNUMX つは透かしで、紙に適用したり、プリンターで印刷する前に追加したりできます。 印刷業者が印刷時に独自の透かし (黄色の点やその他のマーク) を入れることは周知の事実ですが、従業員の職場のコンピューター画面に入れることができるその他の成果物についても検討していきます。 このようなアーティファクトは、ユーザーのワークスペース上にアーティファクトを描画する特別なソフトウェア パッケージによって生成され、ユーザーの作業を妨げることなく、アーティファクト自体の可視性を最小限に抑えます。 これらのテクノロジーは、科学の発展や隠された情報を提示するために使用されるアルゴリズムという点で古いルーツを持っていますが、現代世界では非常にまれです。 このアプローチは主に軍事分野や書類上で、悪徳従業員を迅速に特定するために使用されています。 これらのテクノロジーは商業環境に導入され始めたばかりです。 現在、目に見える透かしはさまざまなメディア ファイルの著作権を保護するために積極的に使用されていますが、目に見えない透かしは非常にまれです。 しかし、それらは同時に最大の関心を呼び起こします。

セキュリティアーティファクト

画面上のアーティファクトの認識 人間には見えない 透かしは、原則として人間の目には見えないさまざまなアーティファクトを形成し、画像内で非常に小さなドットの形でマスクされることがあります。 目に見えないオブジェクトはほとんどのモニターの標準色空間の外にある可能性があるため、可視オブジェクトを考慮します。 これらのアーティファクトは、高度に不可視であるため、特に価値があります。 ただし、CEH を完全に見えなくすることは不可能です。 実装の過程で、コンテナ イメージのある種の歪みがイメージに導入され、ある種のアーティファクトがイメージ上に表示されます。 2 種類のオブジェクトを考えてみましょう。

  1. 循環的
  2. カオス(画像変換により導入)

循環要素は、画面イメージ上で複数回繰り返される、反復要素の特定の有限シーケンスを表します (図 1)。

カオス的アーチファクトは、オーバーレイされた画像 (図 2) のさまざまな種類の変換 (ホログラムの導入など) によって発生する可能性があります。

画面上のアーティファクトの認識
米。 1 サイクリングアーティファクト
画面上のアーティファクトの認識
米。 2 混沌としたアーティファクト

まず、周期的アーティファクトを認識するためのオプションを見てみましょう。 このようなアーティファクトには次のようなものがあります。

  • 画面全体に繰り返されるテキストの透かし
  • バイナリシーケンス
  • 各グリッドセル内のカオス点のセット

リストされたアーティファクトはすべて、表示されたコンテンツの上に直接適用されるため、各カラー チャネルのヒストグラムの局所極値を特定し、それに応じて他のすべての色を除去することによって認識できます。 この方法では、各ヒストグラム チャネルの局所的な極値の組み合わせを操作します。 問題は、多くの急激に変化する詳細を含むかなり複雑な画像内の局所的な極値の検索にあり、ヒストグラムは非常に鋸歯状に見えるため、このアプローチは適用できません。 さまざまなフィルターを適用してみることもできますが、フィルター自体に歪みが生じ、最終的には透かしを検出できなくなる可能性があります。 特定のエッジ検出器 (たとえば、Canny エッジ検出器) を使用してこれらのアーティファクトを認識するオプションもあります。 これらのアプローチは、遷移が非常にシャープなアーティファクトに適しています。検出器は画像の輪郭を強調表示し、続いてその輪郭内の色の範囲を選択して画像を XNUMX 値化し、アーティファクト自体をさらに強調表示できますが、これらの方法では、アーティファクト自体を強調表示するにはかなり微調整が必​​要です。必要な輪郭だけでなく、選択した輪郭の色に応じた画像自体のその後の二値化も行います。 これらのアルゴリズムは非常に信頼性が低いと考えられており、より安定した、画像の色成分の種類に依存しないアルゴリズムを使用しようとしています。

画面上のアーティファクトの認識
米。 3 変換後のウォーターマーク

前述のカオス アーティファクトについては、それらを認識するアルゴリズムが根本的に異なります。 カオス的アーティファクトの形成は、画像に特定の透かしを課すことによって想定されており、これはいくつかの変換 (たとえば、離散フーリエ変換) によって変換されます。 このような変換によるアーティファクトは画面全体に分布しており、そのパターンを特定するのは困難です。 これに基づいて、透かしは「ランダムな」アーチファクトの形で画像全体に配置されます。 このような透かしの認識は、結局のところ、変換関数を使用して画像を直接変換することになります。 変換の結果を図に示します (図 3)。

しかし、理想的とは言えない状況では透かしの認識を妨げる多くの問題が発生します。 変換の種類によっては、画面に対して大きな角度で撮影した文書や、画質がかなり悪い写真、または保存された画面キャプチャを認識できないなど、さまざまな問題が発生する可能性があります。高損失圧縮のファイル。 これらすべての問題により、透かしの識別が複雑になります。角度の付いた画像の場合は、より複雑な変換を適用するか、画像にアフィン変換を適用する必要がありますが、どちらも透かしの​​完全な復元を保証するものではありません。 画面キャプチャの場合を考えると、XNUMX つの問題が発生します。XNUMX つ目は画面自体に表示するときの歪み、XNUMX つ目は画面自体から画像を保存するときの歪みです。 XNUMX つ目は、さまざまな品質のモニター用のマトリックスがあり、色が欠如しているため、その色表現に応じて色が補間され、それによって透かし自体に歪みが生じるため、制御が非常に困難です。 XNUMX 番目の方法はさらに困難です。スクリーンショットを任意の形式で保存すると、色の範囲の一部が失われるため、透かし自体が失われる可能性があります。

実装上の問題

現代世界では、透かしを導入するためのアルゴリズムが非常に多くありますが、実装後に透かしがさらに認識される可能性を 100% 保証するものはありません。 主な困難は、それぞれの特定のケースで発生する可能性のある一連の再生条件を決定することです。 前述したように、歪みや透かしにダメージを与える試みの考えられるすべての特徴を考慮する認識アルゴリズムを作成することは困難です。 たとえば、ガウス フィルターが現在の画像に適用され、元の画像のアーティファクトが非常に小さく、画像の背景に対して対照的であった場合、それらを認識できなくなるか、透かしの一部が失われます。 。 写真の場合を考えてみましょう。写真には高い確率でモアレ (図 5) や「グリッド」 (図 4) が発生します。 モアレは、スクリーンのマトリクスの離散性と記録装置のマトリクスの離散性により発生し、2つのメッシュ画像が重なり合うことになる。 メッシュは透かしアーティファクトを部分的に覆い、認識上の問題を引き起こす可能性が高く、一部の透かし埋め込み方法ではモアレが画像の一部と透かしを重ねるため、モアレを認識できなくなります。

画面上のアーティファクトの認識
米。 4 画像グリッド
画面上のアーティファクトの認識
米。 5 モアレ

透かしを認識するためのしきい値を高めるには、自己学習ニューラル ネットワークに基づいたアルゴリズムを使用する必要があり、アルゴリズム自体が透かし画像の認識を学習します。 現在、Google などから、膨大な数のニューラル ネットワーク ツールやサービスが提供されています。 必要に応じて、一連の参照画像を見つけて、必要なアーティファクトを認識するようにニューラル ネットワークに教えることができます。 このアプローチには、非常に歪んだ透かしであっても識別できる可能性が最も高くなりますが、迅速に識別するには、大規模な計算能力と、正確に識別するための非常に長いトレーニング期間が必要です。

説明したことはすべて非常に単純に見えますが、これらの問題を深く掘り下げるほど、透かしを認識するにはアルゴリズムの実装に多くの時間を費やし、必要な確率に到達させるにはさらに多くの時間を費やす必要があることが理解できます。それぞれのイメージを認識します。

出所: habr.com

コメントを追加します