Identificatie van gebruikers door browsegeschiedenis in de browser

Mozilla-werknemers gepubliceerd resultaten van een onderzoek naar de mogelijkheid om gebruikers te identificeren op basis van een bezoekprofiel in de browser, dat zichtbaar kan zijn voor derden en websites. Uit een analyse van 52 browserprofielen van Firefox-gebruikers die aan het experiment deelnamen, bleek dat voorkeuren bij het bezoeken van sites kenmerkend zijn voor elke gebruiker en constant zijn. Het unieke karakter van de verkregen browsegeschiedenisprofielen was 99%. Tegelijkertijd blijft een hoge mate van uniekheid van de profielen behouden, zelfs als we de steekproef beperken tot slechts honderd populaire sites.

Identificatie van gebruikers door browsegeschiedenis in de browser

De mogelijkheid van heridentificatie werd getest tijdens een experiment van twee weken: er werd geprobeerd gegevens van bezoeken in de eerste week te vergelijken met gegevens uit de tweede week. Het bleek mogelijk om 50% van de gebruikers die 50 of meer verschillende domeinen bezochten, opnieuw te identificeren. Bij een bezoek aan 150 of meer verschillende domeinen nam de heridentificatiedekking toe tot 80%. De test werd uitgevoerd op een steekproef van 10 sites om de gegevens te simuleren die grote contentproviders kunnen verkrijgen (Google kan bijvoorbeeld de toegang tot 9823 van deze 10000 sites controleren, Facebook - 7348, Verizon - 5500).

Met deze functie kunnen grote eigenaren van populaire bronnen gebruikers met een vrij grote waarschijnlijkheid identificeren. Google, Facebook en Twitter, waarvan de widgets worden gehost op sites van derden, zouden theoretisch ongeveer 80% van de gebruikers opnieuw kunnen identificeren.

Identificatie van gebruikers door browsegeschiedenis in de browser

U kunt eerder geopende sites ook via indirecte methoden vaststellen, bijvoorbeeld door populaire domeinen in JavaScript-code te doorzoeken en het verschil in vertragingen bij het laden van bronnen te beoordelen. Als de site onlangs door de gebruiker is geopend, wordt de bron uit de browser opgehaald. cache vrijwel onmiddellijk. Voorheen konden open pagina's worden bepaald оценка caching van HSTS-instellingen (bij het openen van een site met HSTS werd het HTTP-verzoek onmiddellijk omgeleid naar HTTPS zonder te proberen toegang te krijgen tot HTTP) en анализ status van de CSS-eigenschap “bezocht”.

Soortgelijke op CSS gebaseerde methoden voor browsegeschiedenis werden in een soortgelijk onderzoek gebruikt, voerde uit van 2009 tot 2011. Deze onderzoeker toonde aan dat hij 42% van de gebruikers kon identificeren bij het controleren van 50 pagina's en 70% bij het controleren van 500 pagina's. Mozilla-onderzoek bevestigd en verduidelijkte de conclusies van de vorige publicatie, terwijl de nauwkeurigheid van het bepalen van de browsegeschiedenis aanzienlijk was toegenomen en de dekking van gecontroleerde domeinen was verhoogd van 6000 naar 10000 (in totaal werden gegevens verkregen over 660000 domeinen, maar bij het beoordelen van de identificatie werd een Er werd een steekproef van 10 van de meest populaire domeinen gebruikt).

Bron: opennet.ru

Voeg een reactie