Identifikácia používateľov podľa histórie prehliadania v prehliadači

Zamestnanci Mozilly uverejnené výsledky štúdie o možnosti identifikácie používateľov na základe profilu návštev v prehliadači, ktorý môže byť viditeľný pre tretie strany a webové stránky. Analýza 52 tisíc profilov prehliadania poskytnutých používateľmi Firefoxu, ktorí sa zúčastnili experimentu, ukázala, že preferencie pri návšteve stránok sú charakteristické pre každého používateľa a sú konštantné. Jedinečnosť získaných profilov histórie prehliadania bola 99 %. Zároveň je zachovaná vysoká miera jedinečnosti profilov, aj keď vzorku obmedzíme len na sto obľúbených stránok.

Identifikácia používateľov podľa histórie prehliadania v prehliadači

Možnosť opätovnej identifikácie bola testovaná počas dvojtýždňového experimentu – pokus o porovnanie údajov z návštev v prvom týždni s údajmi z druhého týždňa. Ukázalo sa, že bolo možné opätovne identifikovať 50 % používateľov, ktorí navštívili 50 a viac rôznych domén. Pri návšteve 150 alebo viacerých rôznych domén sa pokrytie opätovnej identifikácie zvýšilo na 80 %. Test bol vykonaný na vzorke 10 9823 stránok, aby sa simulovali údaje, ktoré môžu získať veľkí poskytovatelia obsahu (napríklad Google dokáže kontrolovať prístup k 10000 7348 z týchto 5500 XNUMX stránok, Facebook - XNUMX XNUMX, Verizon - XNUMX XNUMX).

Táto funkcia umožňuje veľkým vlastníkom populárnych zdrojov identifikovať používateľov s pomerne vysokou pravdepodobnosťou. Napríklad Google, Facebook a Twitter, ktorých widgety sú hosťované na stránkach tretích strán, by teoreticky mohli znovu identifikovať približne 80 % používateľov.

Identifikácia používateľov podľa histórie prehliadania v prehliadači

Predtým otvorené stránky môžete určiť aj nepriamymi metódami, napríklad prehľadávaním populárnych domén v kóde JavaScript a vyhodnotením rozdielu v oneskoreniach pri načítavaní zdrojov – ak bol web nedávno otvorený používateľom, zdroj sa načíta z prehliadača cache takmer okamžite. Predtým bolo možné použiť na určenie otvorených stránok оценка ukladanie nastavení HSTS do vyrovnávacej pamäte (pri otvorení stránky s HSTS bola požiadavka HTTP okamžite presmerovaná na HTTPS bez pokusu o prístup k HTTP) a analýza stav vlastnosti CSS „navštívené“.

Podobné metódy histórie prehliadania založené na CSS boli použité v podobnej štúdii, uskutočnené od roku 2009 do roku 2011. Tento výskumník preukázal schopnosť identifikovať 42 % používateľov pri kontrole 50 strán a 70 % pri kontrole 500 strán. Mozilla Research potvrdil a spresnil závery predchádzajúcej publikácie, pričom sa výrazne zvýšila presnosť určenia histórie prehliadania a pokrytie kontrolovaných domén sa zvýšilo zo 6000 10000 na 660000 10 (celkovo sa získali údaje o XNUMX XNUMX doménach, ale pri posudzovaní identifikácie sa bola použitá vzorka XNUMX XNUMX najobľúbenejších domén).

Zdroj: opennet.ru

Pridať komentár