Адбітак браўзэра: што гэта, як працуе, ці парушае закон і як абараніцца. Частка 1

Адбітак браўзэра: што гэта, як працуе, ці парушае закон і як абараніцца. Частка 1
Ад Selectel: гэты артыкул першы ў цыкле перакладаў вельмі дэталёвага артыкула аб адбітках браўзэра і тым, як працуе тэхналогія. Тут сабрана ўсё, што вы хацелі ведаць, але баяліся спытаць па гэтай тэме.

Што такое адбіткі браўзэра?

Гэта метад, які выкарыстоўваецца сайтамі і сэрвісамі для адсочвання наведвальнікаў. Карыстачам прысвойваецца ўнікальны ідэнтыфікатар (адбітак). Ён змяшчае шмат інфармацыі аб наладах і магчымасцях браўзэра карыстальнікаў, што выкарыстоўваецца для іх ідэнтыфікацыі. Акрамя таго, адбітак браўзэра дазваляе сайтам адсочваць паводніцкія патэрны, каб пасля яшчэ дакладней ідэнтыфікаваць карыстачоў.

Унікальнасць прыкладна такая ж, як у рэальных адбіткаў пальцаў. Толькі апошнія збірае паліцыя для пошуку падазроных у здзяйсненні злачынстваў. А вось тэхналогія адбітка браўзэраў прымяняецца зусім не для адсочвання злачынцаў. Бо мы ж тут не злачынцы, праўда?

Якія дадзеныя збірае адбітак браўзэра?

Аб тым, што чалавека можна адсачыць па IP, мы ведалі яшчэ на світанку існавання інтэрнэту. Але ў дадзеным выпадку ўсё больш складана. Адбітак браўзэра ўключае IP-адрас, але гэта далёка не найважнейшая інфармацыя. Насамрэч, для таго, каб ідэнтыфікаваць вас, IP не патрэбен.

Згодна з даследаваннем EFF (Electronic Frontier Foundation), адбітак браўзэра ўключае ў сябе:

  • User-agent (уключаючы не толькі браўзэр, але і версію АС, тып прылады, моўныя налады, панэлі прылад і да т.п.).
  • Гадзінны пояс.
  • Дазвол экрана і глыбіню колеру.
  • Supercookies.
  • Налады печыва.
  • Сістэмныя шрыфты.
  • Убудовы да браўзэра і іх версіі.
  • Часопіс наведванняў.

Згодна з вынікамі даследавання EFF, унікальнасць адбітка браўзэра вельмі высокая. Калі казаць аб статыстыцы, то толькі раз на 286777 выпадкаў здараецца поўнае супадзенне адбіткаў браўзэраў двух розных карыстачоў.

Згодна яшчэ аднаму даследаванню, дакладнасць ідэнтыфікацыі карыстальніка пры дапамозе адбітка браўзэра складае 99,24%. Змена аднаго з параметраў браўзэра змяншае дакладнасць ідэнтыфікацыі карыстача толькі на 0,3%. Існуюць тэсты на адбітак браўзэра, якія паказваюць, наколькі вялікі аб'ём інфармацыі збіраецца.

Як працуе адбітак браўзэра

Чаму ўвогуле магчымы збор інфармацыі аб браўзэры? Усё проста - ваш браўзэр абменьваецца дадзенымі з вэб-серверам, калі вы запытваеце адрас сайта. У звычайнай сітуацыі сайты і сэрвісы прысвойваюць карыстачу ўнікальны ідэнтыфікатар.

Напрыклад, «gh5d443ghjflr123ff556ggf».

Гэты радок з выпадковых літар і лічбаў дапамагае серверу пазнаць ваc, асацыяваць ваш браўзэр і вашы перавагі з вамі. Дзеянням, якія вы здзяйсняеце анлайн, будзе прысвоены прыкладна той жа код.

Так, калі вы зайшлі ў Twitter, дзе ёсць нейкая інфармацыя пра вас, усе гэтыя дадзеныя будуць аўтаматычна злучаны з тым жа ідэнтыфікатарам.

Канечне, гэты код не будзе з вамі да канца вашых дзён. Калі вы пачнеце серфить з іншай прылады або браўзэра, то ідэнтыфікатар, хутчэй за ўсё, таксама памяняецца.

Адбітак браўзэра: што гэта, як працуе, ці парушае закон і як абараніцца. Частка 1

Як сайты збіраюць карыстацкія дадзеныя?

Гэта двухузроўневы працэс, які працуе як на баку сервера, так і на баку кліента.

На баку сервера

Логі доступу да сайта

У гэтым выпадку гаворка ідзе аб зборы дадзеных, якія адпраўляюцца браўзэрам. Як мінімум гэта:

  • Запытаны пратакол.
  • Запытаны URL.
  • Ваш IP.
  • Referer.
  • User-agent.

загалоўкі

Вэб-серверы атрымліваюць іх ад вашага браўзэра. Загалоўкі важныя, паколькі яны дазваляюць быць упэўненым, што запытаны сайт працуе з вашым браўзэрам.

Напрыклад, інфармацыя ў загалоўку дазваляе сайту даведацца, ці карыстаецеся вы ПК або мабільную прыладу. У другім выпадку адбудзецца рэдырэкт на аптымізаваную для мабільных прылад версію. Нажаль, гэтыя ж дадзеныя патрапяць у ваш адбітак.

печыва

Тут усё зразумела. Вэб-серверы заўсёды абменьваюцца печыва з браўзэрамі. Калі вы ў настройках паказваеце магчымасць працы з куки, яны захоўваюцца на вашым прыладзе і адпраўляюцца на сервер, калі б вы ні зайшлі на сайт, які ўжо наведвалі раней.

Куки дапамагаюць сярфіць больш камфортна, але яны ж адкрываюць і больш інфармацыі пра вас.

Адбіткі пальцаў на палатне

У гэтым метадзе выкарыстоўваецца элемент палатна (canvas) HTML5, які WebGL таксама выкарыстоўвае для візуалізацыі 2D-і 3D-графікі ў браўзэры.

Гэты метад звычайна «прымушае» браўзэр апрацоўваць графічны кантэнт, уключаючы выявы, тэкст ці тое і іншае зараз. Для вас гэты працэс незаўважны, паколькі ўсё адбываецца ў фоне.

Як толькі працэс завершаны, canvas fingerprinting ператварае графіку ў хэш, які становіцца тым самым унікальным ідэнтыфікатарам, пра які мы казалі вышэй.

Гэты метад дазваляе атрымліваць наступную інфармацыю аб вашым прыладзе:

  • Графічны адаптар.
  • Драйвер графічнага адаптара.
  • Працэсар (калі няма вылучанага графічнага чыпа).
  • Устаноўленыя шрыфты.

Лагіраванне на баку кліента

Тут маецца на ўвазе, што ваш браўзэр абменьваецца вялікай колькасцю інфармацыі дзякуючы:

Adobe Flash і JavaScript

Згодна з FAQ AmIUnique, калі ў вас актываваны JavaScript, то па-за перадаюцца дадзеныя аб вашых убудовах або спецыфікацыях жалеза.

Калі ўсталяваны і актываваны Flash, тое гэта падае іншаму «назіральніку» яшчэ больш інфармацыі, уключаючы:

  • Ваш гадзінны пояс.
  • Версію АС.
  • Дазвол экрана.
  • Поўны спіс устаноўленых у сістэме шрыфтоў.

печыва

Яны гуляюць вельмі важную ролю ў лагаванні. Так, вам звычайна трэба вырашыць, ці дазволіць браўзэру апрацоўваць печыва ці цалкам выдаліць іх.

У першым выпадку вэб-сервер атрымлівае проста велізарную колькасць інфармацыі аб вашым прыладзе і перавагах. Калі вы не ўхваліце ​​працу з куки, сайты ўсё роўна атрымаюць сякія-такія дадзеныя аб вашым браўзэры.

Навошта патрэбная тэхналогія адбітка браўзэра?

У асноўным для таго, каб карыстач прылады атрымаў аптымізаваны для яго прылады сайт, па-за залежнасцю, зайшоў ён у інтэрнэт з планшэта ці смартфона.

Акрамя таго, тэхналогія выкарыстоўваецца для рэкламы. Гэта проста ідэальная прылада дата-майнінгу.

Так, атрымаўшы сабраную серверам інфармацыю, пастаўшчыкі тавараў або паслуг могуць ствараць вельмі тонка нацэленыя рэкламныя кампаніі з персаналізацыяй. Дакладнасць таргетавання значна вышэй, чым калі выкарыстоўваць проста IP-адрасы.

Напрыклад, рэкламшчыкі могуць выкарыстоўваць адбіткі браўзэраў для таго, каб атрымаць спіс карыстачоў сайта, дазвол экрана якіх можна назваць нізкім (напрыклад, 1300*768), хто шукае больш якасныя маніторы ў інтэрнэт-краме прадаўца. Ці ж карыстальнікаў, якія проста сярфяць па сайце без намеру штосьці купіць.

Затым атрыманую інфармацыю можна выкарыстоўваць для таргетавання рэкламы якасных манітораў з высокім дазволам на карыстальнікаў з невялікім і састарэлым маральна дысплеем.

Акрамя таго, тэхналогія адбітка браўзэра выкарыстоўваецца яшчэ і для:

  • Выяўленні фрода і ботнэтаў. Гэта рэальна карысная для банкаў і фінансавых арганізацый функцыя. Яны дазваляюць аддзяліць паводзіны карыстальніка ад актыўнасці зламыснікаў.
  • Вызначэнне VPN і proxy карыстальнікаў. Выведслужбы могуць выкарыстоўваць гэты метад для адсочвання інтэрнэт-карыстальнікаў са ўтоенымі IP-адрасамі.

Адбітак браўзэра: што гэта, як працуе, ці парушае закон і як абараніцца. Частка 1
У канчатковым рахунку, нават калі адбіткі браўзэра выкарыстоўваюцца ў законных мэтах, гэта ўсё роўна вельмі дрэнна адбіваецца на канфідэнцыйнасці карыстачоў. Асабліва калі апошнія спрабуюць абараніцца з дапамогай VPN.

Акрамя таго, адбіткі браўзэра могуць быць лепшым сябрам хакера. Калі ім вядомыя дакладныя дадзеныя аб вашым прыладзе, яны могуць выкарыстоўваць спецыяльныя эксплойты для ўзлому прылады. У гэтым няма нічога складанага - любы кіберзлачынца можа стварыць падроблены сайт са скрыптам зняцця адбіткаў пальцаў.

Нагадаем, гэты артыкул - толькі першая частка, наперадзе яшчэ дзве. У іх разглядаюцца пытанні законнасці збору персанальных дадзеных карыстачоў, магчымасці выкарыстання гэтых дадзеных і метады абароны супраць занадта ўжо актыўных «збіральнікаў».

Адбітак браўзэра: што гэта, як працуе, ці парушае закон і як абараніцца. Частка 1

Крыніца: habr.com