Mozilla 従業員
再識別の可能性は 50 週間の実験でテストされました。最初の週の訪問データと 50 週目のデータを比較する試みが行われました。 150 以上の異なるドメインを訪問したユーザーの 80% を再識別することが可能であることが判明しました。 10 以上の異なるドメインにアクセスすると、再識別範囲は 9823% に増加しました。 このテストは、大規模なコンテンツ プロバイダーが取得できるデータをシミュレートするために 10000 サイトのサンプルに対して実行されました (たとえば、Google はこれら 7348 サイトのうち 5500 サイト、Facebook - XNUMX、Verizon - XNUMX へのアクセスを制御できます)。
この機能により、人気のあるリソースの大規模所有者は、かなり高い確率でユーザーを識別できます。 たとえば、Google、Facebook、Twitter のウィジェットはサードパーティのサイトでホストされており、理論的にはユーザーの約 80% を再識別できる可能性があります。
また、間接的な方法で以前に開いたサイトを特定することもできます。たとえば、JavaScript コードで人気のドメインを検索し、リソースを読み込む際の遅延の違いを評価します。サイトがユーザーによって最近開かれた場合、リソースはブラウザーから取得されます。ほぼ即座にキャッシュされます。 以前は、開いているページを判断するために使用できました
同様の CSS ベースの閲覧履歴手法が同様の研究で使用されました。
出所: オープンネット.ru