Identifikace uživatelů podle historie prohlížení v prohlížeči

Zaměstnanci Mozilly publikováno výsledky studie možnosti identifikace uživatelů na základě profilu návštěv v prohlížeči, který může být viditelný pro třetí strany a webové stránky. Analýza 52 tisíc profilů prohlížení poskytnutých uživateli Firefoxu, kteří se zúčastnili experimentu, ukázala, že preference při návštěvě stránek jsou charakteristické pro každého uživatele a jsou konstantní. Jedinečnost získaných profilů historie prohlížení byla 99 %. Vysoká míra jedinečnosti profilů je přitom zachována i v případě, že vzorek omezíme pouze na sto oblíbených stránek.

Identifikace uživatelů podle historie prohlížení v prohlížeči

Možnost opětovné identifikace byla testována během dvoutýdenního experimentu – byl učiněn pokus porovnat data z návštěv v prvním týdnu s daty z týdne druhého. Ukázalo se, že bylo možné znovu identifikovat 50 % uživatelů, kteří navštívili 50 a více různých domén. Při návštěvě 150 nebo více různých domén se pokrytí reidentifikace zvýšilo na 80 %. Test byl proveden na vzorku 10 tisíc webů, aby se simulovala data, která mohou velcí poskytovatelé obsahu získat (například Google může kontrolovat přístup k 9823 10000 z těchto 7348 5500 webů, Facebook – XNUMX XNUMX, Verizon – XNUMX XNUMX).

Tato funkce umožňuje velkým vlastníkům populárních zdrojů identifikovat uživatele s poměrně vysokou pravděpodobností. Například Google, Facebook a Twitter, jejichž widgety jsou hostovány na stránkách třetích stran, by teoreticky mohly znovu identifikovat přibližně 80 % uživatelů.

Identifikace uživatelů podle historie prohlížení v prohlížeči

Dříve otevřené stránky můžete určit také nepřímými metodami, například prohledáním oblíbených domén v kódu JavaScript a posouzením rozdílu ve zpoždění při načítání zdrojů – pokud byl web nedávno otevřen uživatelem, zdroj bude načten z prohlížeče cache téměř okamžitě. Dříve bylo možné použít k určení otevřených stránek оценка ukládání nastavení HSTS do mezipaměti (při otevření webu s HSTS byl požadavek HTTP okamžitě přesměrován na HTTPS bez pokusu o přístup k HTTP) a анализ stav vlastnosti CSS „navštíveno“.

Podobné metody historie procházení založené na CSS byly použity v podobné studii, odneseno od roku 2009 do roku 2011. Tento výzkumník prokázal schopnost identifikovat 42 % uživatelů při kontrole 50 stran a 70 % při kontrole 500 stran. Výzkum Mozilly potvrzeno a upřesnil závěry předchozí publikace, přičemž došlo k výraznému zvýšení přesnosti stanovení historie prohlížení a zvýšení pokrytí kontrolovaných domén z 6000 10000 na 660000 10 (celkem byla získána data o XNUMX XNUMX doménách, ale při posuzování identifikace byla byl použit vzorek XNUMX tisíc nejoblíbenějších domén).

Zdroj: opennet.ru

Přidat komentář