A felhasználók azonosítása a böngésző böngészési előzményei alapján

Mozilla alkalmazottai közzétett egy olyan tanulmány eredményei, amely a felhasználók azonosításának lehetőségét vizsgálja a böngészőben végzett látogatások profilja alapján, amely harmadik felek és webhelyek számára is látható. A kísérletben részt vevő Firefox-felhasználók 52 ezer böngészési profiljának elemzése azt mutatta, hogy az oldallátogatási preferenciák minden felhasználóra jellemzőek és állandóak. A kapott böngészési előzményprofilok egyedisége 99%-os volt. Ugyanakkor a profilok magas fokú egyedisége megmarad akkor is, ha csak száz népszerű oldalra korlátozzuk a mintát.

A felhasználók azonosítása a böngésző böngészési előzményei alapján

Az újraazonosítás lehetőségét egy kéthetes kísérlet során tesztelték – az első heti látogatások adatait próbálták összehasonlítani a második hét adataival. Kiderült, hogy az 50 vagy több különböző domaint meglátogató felhasználók 50%-át sikerült újra azonosítani. 150 vagy több különböző domain meglátogatásakor az újraazonosítási lefedettség 80%-ra nőtt. A tesztet 10 ezer webhelyből álló mintán végezték el, hogy szimulálják azokat az adatokat, amelyeket a nagy tartalomszolgáltatók megszerezhetnek (például a Google ebből a 9823 10000 webhelyből 7348, a Facebook - 5500, a Verizon - XNUMX) hozzáférését tudja szabályozni.

Ez a funkció lehetővé teszi a népszerű erőforrások nagy tulajdonosai számára, hogy meglehetősen nagy valószínűséggel azonosítsák a felhasználókat. Például a Google, a Facebook és a Twitter, amelyek widgetjeit harmadik felek webhelyein tárolják, elméletileg a felhasználók körülbelül 80%-át újra azonosítani tudná.

A felhasználók azonosítása a böngésző böngészési előzményei alapján

A korábban megnyitott webhelyeket közvetett módszerekkel is meghatározhatja, például úgy, hogy JavaScript kódban keres a népszerű domainek között, és felméri a késések közötti különbségeket az erőforrások betöltésekor - ha a webhelyet nemrég nyitotta meg a felhasználó, akkor az erőforrás lekérésre kerül a böngészőből. gyorsítótár szinte azonnal. Korábban a nyitott oldalak meghatározására lehetett használni оценка a HSTS-beállítások gyorsítótárazása (egy webhely HSTS-sel történő megnyitásakor a HTTP kérés azonnal át lett irányítva a HTTPS-re anélkül, hogy megpróbálta volna elérni a HTTP-t) és elemzés a „látogatott” CSS-tulajdon állapota.

Hasonló CSS-alapú böngészéstörténeti módszereket használtak egy hasonló tanulmányban, végrehajtani 2009-től 2011-ig. Ez a kutató kimutatta, hogy 42 oldal ellenőrzésekor a felhasználók 50%-át, 70 oldal ellenőrzésekor pedig 500%-át képes azonosítani. Mozilla Research megerősített és pontosította az előző publikáció következtetéseit, miközben jelentősen megnőtt a böngészési előzmények meghatározásának pontossága, az ellenőrzött domainek lefedettsége pedig 6000-ről 10000-re nőtt (összesen 660000 domainről készült adat, de az azonosítás értékelésekor a 10 ezer legnépszerűbb domain mintáját használtuk).

Forrás: opennet.ru

Hozzászólás