Identificación de usuarios mediante el historial de navegación en el navegador

Empleados de Mozilla publicado Resultados de un estudio sobre la posibilidad de identificar a los usuarios a partir de un perfil de visitas en el navegador, que puede ser visible para terceros y sitios web. Un análisis de 52 mil perfiles de navegación proporcionados por los usuarios de Firefox que participaron en el experimento mostró que las preferencias a la hora de visitar sitios son características de cada usuario y son constantes. La singularidad de los perfiles del historial de navegación obtenidos fue del 99%. Al mismo tiempo, se mantiene un alto grado de singularidad de los perfiles incluso si limitamos la muestra a sólo cien sitios populares.

Identificación de usuarios mediante el historial de navegación en el navegador

La posibilidad de reidentificación se probó durante un experimento de dos semanas: se intentó comparar los datos de las visitas de la primera semana con los datos de la segunda semana. Resultó que era posible volver a identificar al 50% de los usuarios que visitaron 50 o más dominios diferentes. Al visitar 150 o más dominios diferentes, la cobertura de reidentificación aumentó al 80%. La prueba se realizó en una muestra de 10 sitios para simular los datos que pueden obtener los grandes proveedores de contenidos (por ejemplo, Google puede controlar el acceso a 9823 de estos 10000 sitios, Facebook - 7348, Verizon - 5500).

Esta característica permite a los grandes propietarios de recursos populares identificar a los usuarios con una probabilidad bastante alta. Por ejemplo, Google, Facebook y Twitter, cuyos widgets están alojados en sitios de terceros, en teoría podrían volver a identificar aproximadamente al 80% de los usuarios.

Identificación de usuarios mediante el historial de navegación en el navegador

También puede determinar los sitios abiertos anteriormente mediante métodos indirectos, por ejemplo, buscando en dominios populares en código JavaScript y evaluando la diferencia en los retrasos al cargar recursos: si el usuario abrió el sitio recientemente, el recurso se recuperará del navegador. caché casi al instante. Anteriormente, para determinar las páginas abiertas se podían utilizar оценка almacenamiento en caché de la configuración de HSTS (al abrir un sitio con HSTS, la solicitud HTTP se redirigió inmediatamente a HTTPS sin intentar acceder a HTTP) y анализ Estado de la propiedad CSS "visitada".

En un estudio similar se utilizaron métodos similares de historial de navegación basados ​​en CSS, llevado a cabo de 2009 a 2011. Este investigador demostró la capacidad de identificar el 42% de los usuarios cuando revisan 50 páginas y el 70% cuando revisan 500 páginas. Investigación Mozilla confirmado y aclaró las conclusiones de la publicación anterior, mientras que la precisión para determinar el historial de navegación aumentó significativamente y la cobertura de dominios verificados aumentó de 6000 a 10000 (en total, se obtuvieron datos sobre 660000 dominios, pero al evaluar la identificación, un Se utilizó una muestra de 10 mil de los dominios más populares).

Fuente: opennet.ru

Añadir un comentario