Identificazione degli utenti tramite la cronologia di navigazione nel browser

Dipendenti Mozilla hanno pubblicato risultati di uno studio sulla possibilità di identificare gli utenti in base a un profilo di visite nel browser, che potrebbe essere visibile a terzi e siti web. Dall'analisi di 52mila profili di navigazione forniti dagli utenti di Firefox che hanno preso parte all'esperimento è emerso che le preferenze nella visita dei siti sono caratteristiche di ciascun utente e sono costanti. L'unicità dei profili della cronologia di navigazione ottenuti è stata del 99%. Allo stesso tempo, viene mantenuto un elevato grado di unicità dei profili anche se limitiamo il campione a soli cento siti popolari.

Identificazione degli utenti tramite la cronologia di navigazione nel browser

La possibilità di reidentificazione è stata testata durante un esperimento di due settimane: si è tentato di confrontare i dati delle visite della prima settimana con i dati della seconda settimana. Si è scoperto che era possibile identificare nuovamente il 50% degli utenti che hanno visitato 50 o più domini diversi. Quando si visitano 150 o più domini diversi, la copertura della reidentificazione aumenta fino all'80%. Il test è stato eseguito su un campione di 10mila siti per simulare i dati che possono ottenere i grandi fornitori di contenuti (ad esempio, Google può controllare l'accesso a 9823 di questi 10000 siti, Facebook - 7348, Verizon - 5500).

Questa funzione consente ai grandi proprietari di risorse popolari di identificare gli utenti con una probabilità sufficientemente elevata. Ad esempio, Google, Facebook e Twitter, i cui widget sono ospitati su siti di terze parti, potrebbero teoricamente identificare nuovamente circa l'80% degli utenti.

Identificazione degli utenti tramite la cronologia di navigazione nel browser

Puoi anche determinare i siti aperti in precedenza con metodi indiretti, ad esempio cercando tra i domini popolari nel codice JavaScript e valutando la differenza nei ritardi durante il caricamento delle risorse: se il sito è stato aperto di recente dall'utente, la risorsa verrà recuperata dal browser cache quasi istantaneamente. In precedenza, era possibile utilizzare per determinare le pagine aperte оценка memorizzazione nella cache delle impostazioni HSTS (all'apertura di un sito con HSTS, la richiesta HTTP veniva immediatamente reindirizzata a HTTPS senza tentare di accedere a HTTP) e анализ stato della proprietà CSS “visitata”.

Metodi simili per la cronologia di navigazione basati su CSS sono stati utilizzati in uno studio simile, eseguito dal 2009 al 2011. Questo ricercatore ha dimostrato la capacità di identificare il 42% degli utenti quando controllano 50 pagine e il 70% quando controllano 500 pagine. Ricerca Mozilla confermato e ha chiarito le conclusioni della pubblicazione precedente, mentre l'accuratezza della determinazione della cronologia di navigazione è stata notevolmente aumentata e la copertura dei domini controllati è aumentata da 6000 a 10000 (in totale, i dati sono stati ottenuti su 660000 domini, ma nel valutare l'identificazione, un è stato utilizzato un campione di 10mila domini più popolari).

Fonte: opennet.ru

Aggiungi un commento