Ідентифікація користувачів з історії відвідувань у браузері

Співробітники компанії Mozilla опублікували результати дослідження можливості ідентифікації користувачів на основі профілю відвідувань у браузері, який може бути видно третім особам та сайтам. Аналіз 52 тисяч профілів відвідувань, наданих користувачами Firefox, які взяли участь в експерименті, показав, що переваги відвідування сайтів характерні для кожного користувача і постійні. Унікальність одержаних профілів історії відвідувань становила 99%. При цьому високий рівень унікальності профілів зберігається навіть якщо обмежити вибірку тільки сотнею популярних сайтів.

Ідентифікація користувачів з історії відвідувань у браузері

Перевірка можливості повторної ідентифікації проводилася в ході двотижневого експерименту — дані про відвідування першого тижня спробували зіставити з даними за другий тиждень. З'ясувалося, що можна повторно ідентифікувати 50% користувачів, які відвідали 50 і більше доменів. При відвідуванні 150 та більше різних доменів охоплення повторної ідентифікації збільшувалося до 80%. Перевірка виконувалася у вибірці з 10 тисяч сайтів для симуляції даних, які можуть отримати великі провайдери контенту (наприклад, Google може контролювати звернення до 9823 сайтів із цих 10000, Facebook до 7348, Verizon до 5500).

Зазначена особливість дозволяє великим власникам популярних ресурсів із досить високою ймовірністю ідентифікувати користувачів. Наприклад, компанії Google, Facebook та Twitter, віджети яких розміщуються на сторонніх сайтах, теоретично можуть повторно ідентифікувати приблизно 80% користувачів.

Ідентифікація користувачів з історії відвідувань у браузері

Визначити раніше відкриті сайти також можна непрямими методами, наприклад шляхом перебору в коді на JavaScript популярних доменів з оцінкою відмінності затримок при завантаженні ресурсів — якщо сайт був нещодавно відкритий користувачем, то ресурс буде виданий з кеша браузера майже миттєво. Раніше для визначення відкритих сторінок могли застосовуватись оцінка кешування налаштувань HSTS (при відкритті сайту з HSTS, HTTP-запит одразу перенаправлявся на HTTPS без спроби звернення по HTTP) та аналіз стану CSS-властивості «visited».

Подібні методи визначення історії відвідувань на основі CSS використовувалися у схожому дослідженні, проведеному з 2009 до 2011 року. Дане дослідники показало можливість ідентифікації 42% користувачів під час перевірки 50 сторінок і 70% під час перевірки 500 сторінок. Дослідження Mozilla підтвердило і уточнило висновки минулої публікації, при цьому була істотно підвищена точність визначення історії відвідувань, а охоплення доменів, що перевіряються, було збільшено з 6000 до 10000 (всього були отримані дані про 660000 доменів, але при оцінці ідентифікації використовувалася вибірка в 10 тисяч найбільш популярних доменів).

Джерело: opennet.ru

Додати коментар або відгук