Идентифициране на потребители чрез история на сърфиране в браузъра

Служители на Mozilla публикувано резултати от проучване на възможността за идентифициране на потребителите въз основа на профил на посещения в браузъра, който може да бъде видим за трети страни и уебсайтове. Анализ на 52 хиляди профили за сърфиране, предоставени от потребители на Firefox, участвали в експеримента, показа, че предпочитанията за посещаване на сайтове са характерни за всеки потребител и са постоянни. Уникалността на получените профили на историята на сърфирането е 99%. В същото време се запазва висока степен на уникалност на профилите, дори ако ограничим извадката само до сто популярни сайта.

Идентифициране на потребители чрез история на сърфиране в браузъра

Възможността за повторна идентификация е тествана по време на двуседмичен експеримент - направен е опит да се сравнят данните от посещенията през първата седмица с данните от втората седмица. Оказа се, че е възможно повторно идентифициране на 50% от потребителите, които са посетили 50 или повече различни домейна. При посещение на 150 или повече различни домейна покритието на повторната идентификация се увеличава до 80%. Тестът е направен върху извадка от 10 хиляди сайта, за да се симулират данните, които големите доставчици на съдържание могат да получат (например Google може да контролира достъпа до 9823 от тези 10000 7348 сайта, Facebook - 5500, Verizon - XNUMX).

Тази функция позволява на големите собственици на популярни ресурси да идентифицират потребителите с доста голяма вероятност. Например Google, Facebook и Twitter, чиито уиджети се хостват на сайтове на трети страни, биха могли теоретично да преидентифицират приблизително 80% от потребителите.

Идентифициране на потребители чрез история на сърфиране в браузъра

Можете също така да определите вече отворени сайтове чрез косвени методи, например чрез търсене в популярни домейни в JavaScript код и оценка на разликата в закъсненията при зареждане на ресурси - ако сайтът е бил наскоро отворен от потребителя, ресурсът ще бъде извлечен от браузъра кеш почти мигновено. Преди можеше да се използва за определяне на отворените страници оценка кеширане на HSTS настройки (при отваряне на сайт с HSTS, HTTP заявката беше незабавно пренасочена към HTTPS без опит за достъп до HTTP) и анализ състояние на „посетено“ свойство на CSS.

Подобни базирани на CSS методи за хронология на сърфирането са използвани в подобно проучване, извършено от 2009 до 2011 г. Този изследовател показа способността да идентифицира 42% от потребителите при проверка на 50 страници и 70% при проверка на 500 страници. Mozilla Research потвърдено и изясни заключенията от предишната публикация, докато точността на определяне на историята на сърфиране беше значително увеличена и покритието на проверените домейни беше увеличено от 6000 10000 на 660000 10 (общо бяха получени данни за XNUMX XNUMX домейна, но при оценка на идентификацията, a използвана е извадка от XNUMX хиляди от най-популярните домейни).

Източник: opennet.ru

Добавяне на нов коментар