Ідэнтыфікацыя карыстальнікаў па гісторыі наведванняў у браўзэры

Супрацоўнікі кампаніі Mozilla апублікавалі вынікі даследавання магчымасці ідэнтыфікацыі карыстальнікаў на падставе профіля наведванняў у браўзэры, які можа быць бачны трэцім асобам і сайтам. Аналіз 52 тысяч профіляў наведванняў, прадстаўленых карыстачамі Firefox, якія прынялі ўдзел у эксперыменце, паказаў, што перавагі ў наведванні сайтаў характэрны для кожнага карыстача і сталыя. Унікальнасць атрыманых профіляў гісторыі наведванняў склала 99 працэнтаў. Пры гэтым высокая ступень унікальнасці профіляў захоўваецца нават калі абмежаваць выбарку толькі сотняй папулярных сайтаў.

Ідэнтыфікацыя карыстальнікаў па гісторыі наведванняў у браўзэры

Праверка магчымасці паўторнай ідэнтыфікацыі праводзілася падчас двухтыднёвага эксперыменту – дадзеныя аб наведваннях у першы тыдзень паспрабавалі супаставіць з дадзенымі за другі тыдзень. Высветлілася, што можна паўторна ідэнтыфікаваць 50% карыстальнікаў, якія наведалі 50 і больш розных даменаў. Пры наведванні 150 і больш розных даменаў ахоп паўторнай ідэнтыфікацыі павялічваўся да 80 працэнтаў. Праверка выконвалася ў выбарцы з 10 тысяч сайтаў для сімуляцыі дадзеных, якія могуць атрымаць буйныя правайдэры кантэнту (напрыклад, Google можа кантраляваць звароты да 9823 сайтаў з гэтых 10000, Facebook да 7348, Verizon да 5500).

Указаная асаблівасць дазваляе буйным уладальнікам папулярных рэсурсаў з дастаткова высокай верагоднасцю ідэнтыфікаваць карыстальнікаў. Напрыклад, кампаніі Google, Facebook і Twitter, фішкі якіх размяшчаюцца на іншых сайтах, тэарэтычна могуць паўторна ідэнтыфікаваць прыкладна 80% карыстачоў.

Ідэнтыфікацыя карыстальнікаў па гісторыі наведванняў у браўзэры

Вызначыць раней адкрытыя сайты таксама можна ўскоснымі метадамі, напрыклад, шляхам перабору ў кодзе на JavaScript папулярных даменаў з ацэнкай адрознення затрымак пры загрузцы рэсурсаў - калі сайт быў нядаўна адкрыты карыстачом, то рэсурс будзе выдадзены з кэша браўзэра амаль імгненна. Раней для вызначэння адкрытых старонак маглі прымяняцца адзнака кэшавання налад HSTS (пры адкрыцці сайта з HSTS, HTTP-запыт адразу перанакіроўваўся на HTTPS без спробы звароту па HTTP) і аналіз станы CSS-уласцівасці «visited».

Падобныя метады вызначэння гісторыі наведванняў на аснове CSS выкарыстоўваліся ў падобным даследаванні, які праводзіцца з 2009 па 2011 год. Дадзенае даследнікі паказала магчымасць ідэнтыфікацыі 42% карыстачоў пры праверцы 50 старонак і 70% пры праверцы 500 старонак. Даследаванне Mozilla пацвердзіла і ўдакладніла высновы мінулай публікацыі, пры гэтым была істотна падвышана дакладнасць вызначэння гісторыі наведванняў, а ахоп правяраных даменаў быў павялічаны з 6000 да 10000 (усяго былі атрыманы дадзеныя аб 660000 даменах, але пры адзнацы ідэнтыфікацыі выкарыстоўвалася выбарка ў 10 тысяч найболей папулярных даменаў).

Крыніца: opennet.ru

Дадаць каментар