ブラウザの閲覧履歴による利用者の特定

Mozilla 従業員 公開 ブラウザでの訪問プロファイルに基づいてユーザーを特定できる可能性に関する研究の結果。このプロファイルは第三者や Web サイトに表示される可能性があります。 実験に参加した Firefox ユーザーから提供された 52 件の閲覧プロファイルを分析したところ、サイトにアクセスする際の好みは各ユーザーの特徴であり、一定であることがわかりました。 取得した閲覧履歴プロファイルの一意性は99%でした。 同時に、サンプルを XNUMX の人気サイトに限定したとしても、プロファイルの高度な独自性は維持されます。

ブラウザの閲覧履歴による利用者の特定

再識別の可能性は 50 週間の実験でテストされました。最初の週の訪問データと 50 週目のデータを比較する試みが行われました。 150 以上の異なるドメインを訪問したユーザーの 80% を再識別することが可能であることが判明しました。 10 以上の異なるドメインにアクセスすると、再識別範囲は 9823% に増加しました。 このテストは、大規模なコンテンツ プロバイダーが取得できるデータをシミュレートするために 10000 サイトのサンプルに対して実行されました (たとえば、Google はこれら 7348 サイトのうち 5500 サイト、Facebook - XNUMX、Verizon - XNUMX へのアクセスを制御できます)。

この機能により、人気のあるリソースの大規模所有者は、かなり高い確率でユーザーを識別できます。 たとえば、Google、Facebook、Twitter のウィジェットはサードパーティのサイトでホストされており、理論的にはユーザーの約 80% を再識別できる可能性があります。

ブラウザの閲覧履歴による利用者の特定

また、間接的な方法で以前に開いたサイトを特定することもできます。たとえば、JavaScript コードで人気のドメインを検索し、リソースを読み込む際の遅延の違いを評価します。サイトがユーザーによって最近開かれた場合、リソースはブラウザーから取得されます。ほぼ即座にキャッシュされます。 以前は、開いているページを判断するために使用できました оценка HSTS 設定のキャッシュ (HSTS でサイトを開くと、HTTP リクエストは HTTP へのアクセスを試行せずにすぐに HTTPS にリダイレクトされました) анализ CSS プロパティの状態は「visited」です。

同様の CSS ベースの閲覧履歴手法が同様の研究で使用されました。 実施した 2009 年から 2011 年まで。 この研究者は、42 ページをチェックすると 50%、70 ページをチェックすると 500% のユーザーを識別できる能力を示しました。 モジラの研究 確認済み と、前回の出版物の結論を明確にしましたが、閲覧履歴を判断する精度が大幅に向上し、チェックされたドメインの範囲が 6000 から 10000 に増加しました (合計 660000 のドメインについてデータが取得されましたが、識別を評価する際には、最も人気のある 10 のドメインのサンプルが使用されました)。

出所: オープンネット.ru

コメントを追加します