通过浏览器中的浏览历史记录来识别用户

Mozilla 员工 发表 根据浏览器中的访问资料(第三方和网站可能会看到)识别用户的可能性的研究结果。 对参与实验的 Firefox 用户提供的 52 个浏览配置文件的分析表明,访问网站的偏好是每个用户的特征,并且是恒定的。 获得的浏览历史配置文件的唯一性为99%。 同时,即使我们将样本限制为仅一百个热门网站,配置文件也能保持高度的唯一性。

通过浏览器中的浏览历史记录来识别用户

在为期两周的实验中测试了重新识别的可能性 - 尝试将第一周的访问数据与第二周的数据进行比较。 事实证明,可以重新识别访问 50 个或更多不同域的 50% 的用户。 当访问 150 个或更多不同域时,重新识别覆盖率增加到 80%。 该测试以 10 个网站为样本进行,以模拟大型内容提供商可以获得的数据(例如,Google 可以控制对这 9823 个网站中 10000 个网站的访问,Facebook - 7348 个,Verizon - 5500 个)。

该功能使得热门资源的大拥有者能够以相当高的概率识别出用户。 例如,Google、Facebook 和 Twitter 的小部件托管在第三方网站上,理论上可以重新识别大约 80% 的用户。

通过浏览器中的浏览历史记录来识别用户

您还可以通过间接方法确定以前打开过的站点,例如,通过在 JavaScript 代码中搜索热门域并评估加载资源时的延迟差异 - 如果该站点最近被用户打开,则将从浏览器检索资源几乎立即缓存。 以前,可以使用来确定打开的页面 оценка 缓存 HSTS 设置(当使用 HSTS 打开站点时,HTTP 请求立即重定向到 HTTPS,而不尝试访问 HTTP)以及 分析 CSS 属性“visited”的状态。

类似的研究中使用了类似的基于 CSS 的浏览历史记录方法, 执行 从 2009 年到 2011 年。 该研究人员显示,在检查 42 个页面时,能够识别出 50% 的用户;在检查 70 个页面时,识别率高达 500%。 莫兹拉研究 确认 并澄清了之前出版物的结论,同时确定浏览历史的准确性显着提高,检查域的覆盖范围从6000个增加到10000个(总共获得了660000个域的数据,但在评估身份时,使用了 10 个最流行域的样本)。

来源: opennet.ru

添加评论