Відбиток браузера: що це, як працює, чи порушує закон і як захиститись. Частина 1

Відбиток браузера: що це, як працює, чи порушує закон і як захиститись. Частина 1
Від Selectel: ця перша стаття в циклі перекладів дуже детальної статті про відбитки браузера і те, як працює технологія. Тут зібрано все, що ви хотіли знати, але боялися запитати на цю тему.

Що таке відбитки браузера?

Це метод, який використовується сайтами та сервісами для відстеження відвідувачів. Користувачам надається унікальний ідентифікатор (відбиток). Він містить багато інформації про налаштування та можливості браузера користувачів, що використовується для їх ідентифікації. Крім того, відбиток браузера дозволяє сайтам відстежувати патерни поведінки, щоб згодом ще точніше ідентифікувати користувачів.

Унікальність приблизно така сама, як у реальних відбитків пальців. Тільки останні збирає поліція для пошуку підозрюваних у скоєнні злочинів. А ось технологія відбитка браузерів застосовується не для відстеження злочинців. Адже ми тут не злочинці, правда?

Які дані збирає відбиток браузера?

Про те, що людину можна відстежити по IP, ми знали ще на зорі існування інтернету. Але в цьому випадку все набагато складніше. Відбиток браузера включає IP-адресу, але це далеко не найважливіша інформація. Насправді, для того, щоб ідентифікувати вас, IP не потрібне.

Згідно з дослідженням EFF (Electronic Frontier Foundation), відбиток браузера включає:

  • User-agent (включаючи не лише браузер, а й версію ОС, тип пристрою, мовні налаштування, панелі інструментів тощо).
  • Часовий пояс.
  • Роздільна здатність екрана і глибина кольору.
  • Supercookies.
  • Налаштування куки.
  • Системні шрифти.
  • Плагіни до браузера та їх версії.
  • Журнал відвідувань.

Згідно з результатами дослідження EFF, унікальність відбитка браузера є дуже високою. Якщо говорити про статистику, то тільки раз на 286777 XNUMX випадків трапляється повний збіг відбитків браузерів двох різних користувачів.

Згідно ще одному дослідженню, Точність ідентифікації користувача за допомогою відбитка браузера становить 99,24%. Зміна одного із параметрів браузера знижує точність ідентифікації користувача лише на 0,3%. Існують тести на відбиток браузера, які свідчать, наскільки великий обсяг інформації збирається.

Як працює відбиток браузера

Чому взагалі можливий збір інформації про браузер? Все просто - ваш браузер обмінюється даними з веб-сервером, коли ви просите адресу сайту. У звичайній ситуації сайти та сервіси надають користувачеві унікальний ідентифікатор.

Наприклад, "gh5d443ghjflr123ff556ggf".

Цей рядок з випадкових літер і цифр допомагає серверу дізнатися вас, асоціювати ваш браузер і ваші уподобання з вами. Діям, які ви робите онлайн, буде присвоєно приблизно той самий код.

Так, якщо ви зайшли в Twitter, де є якась інформація про вас, всі ці дані будуть автоматично пов'язані з тим самим ідентифікатором.

Звісно, ​​цей код не буде з вами до кінця ваших днів. Якщо ви почнете серфить з іншого пристрою або браузера, то ідентифікатор, швидше за все, також зміниться.

Відбиток браузера: що це, як працює, чи порушує закон і як захиститись. Частина 1

Як сайти збирають дані користувача?

Це дворівневий процес, який працює як за сервера, і за клієнта.

На стороні сервера

Логи доступу до сайту

У цьому випадку йдеться про збір даних, що надсилаються браузером. Як мінімум це:

  • Запитаний протокол.
  • Запрошений URL.
  • Ваш IP.
  • Referer.
  • User-agent.

Заголовки

Веб-сервери одержують їх від вашого браузера. Заголовки важливі, оскільки вони дають змогу бути впевненим, що запитаний сайт працює з вашим браузером.

Наприклад, інформація в заголовку дозволяє сайту дізнатися, чи ви використовуєте ПК або мобільний пристрій. У другому випадку відбудеться редирект на оптимізовану для мобільних пристроїв версію. На жаль, ці дані потраплять у ваш відбиток.

кукі

Тут усе зрозуміло. Веб-сервери завжди обмінюються cookie з браузерами. Якщо ви в налаштуваннях вказуєте можливість роботи з cookie, вони зберігаються на вашому пристрої і відправляються на сервер, коли б ви не зайшли на сайт, який вже відвідували раніше.

Куки допомагають серфить комфортніше, але вони ж відкривають і більше інформації про вас.

Відбитки пальців на полотні

У цьому методі використовується елемент полотна (canvas) HTML5, який WebGL також використовує для візуалізації 2D- та 3D-графіки у браузері.

Цей метод зазвичай «примушує» браузер обробляти графічний контент, включаючи зображення, текст чи інше разом. Для вас цей процес непомітний, оскільки все відбувається на тлі.

Як тільки процес завершено, canvas fingerprinting перетворює графіку на хеш, який стає тим самим унікальним ідентифікатором, про який ми говорили вище.

Цей метод дозволяє отримувати наступну інформацію про ваш пристрій:

  • Графічний адаптер.
  • Драйвер графічного адаптера.
  • Процесор (якщо немає виділеного графічного чіпа).
  • Встановлені шрифти.

Логування на стороні клієнта

Тут мається на увазі, що ваш браузер обмінюється великою кількістю інформації завдяки:

Adobe Flash та JavaScript

Відповідно до FAQ AmIUnique, якщо у вас активований JavaScript, то зовні передаються дані про ваші плагіни або специфікації заліза.

Якщо встановлений та активований Flash, це надає сторонньому «спостерігачеві» ще більше інформації, включаючи:

  • Ваш часовий пояс.
  • Версію ОС.
  • Розширення екрану.
  • Повний перелік встановлених у системі шрифтів.

кукі

Вони відіграють важливу роль у логуванні. Так, вам зазвичай потрібно вирішити, чи дозволити браузеру обробляти куки або повністю видалити їх.

У першому випадку веб-сервер отримує просто величезну кількість інформації про ваш пристрій та уподобання. Якщо ви не схвалите роботу з куки, сайти все одно отримають деякі дані про ваш браузер.

Для чого потрібна технологія відбитка браузера?

В основному для того, щоб користувач пристрою отримав оптимізований для нього сайт, незалежно, зайшов він в інтернет з планшета або смартфона.

Окрім того, технологія використовується для реклами. Це просто ідеальний інструмент дата-майнінгу.

Так, отримавши зібрану сервером інформацію, постачальники товарів чи послуг можуть створювати дуже тонко орієнтовані рекламні кампанії з персоналізацією. Точність таргетування набагато вище, ніж якщо просто використовувати IP-адреси.

Наприклад, рекламники можуть використовувати відбитки браузерів для того, щоб отримати список користувачів сайту, роздільну здатність екрана яких можна назвати низьким (наприклад, 1300*768), хто шукає якісніші монітори в інтернет-магазині продавця. Або ж користувачів, які просто серфлять по сайту без наміру щось купити.

Потім отриману інформацію можна використовувати для таргетування реклами якісних моніторів з високою роздільною здатністю користувачів з невеликим і застарілим морально дисплеєм.

Крім того, технологія відбитка браузера використовується ще й для:

  • Виявлення фрода та ботнетів. Це реально корисна для банків та фінансових організацій функція. Вони дозволяють відокремити поведінку користувача від активності зловмисників.
  • Визначення VPN та proxy користувачів. Розвідслужби можуть використовувати цей метод для відстеження користувачів з прихованими IP-адресами.

Відбиток браузера: що це, як працює, чи порушує закон і як захиститись. Частина 1
Зрештою, навіть якщо відбитки браузера використовуються в законних цілях, це все одно дуже погано позначається на конфіденційності користувачів. Особливо якщо останні намагаються захиститись за допомогою VPN.

Крім того, відбитки браузера можуть бути найкращим другом хакера. Якщо їм відомі точні дані про ваш пристрій, вони можуть використовувати спеціальні експлойти для зламування пристрою. У цьому немає нічого складного – будь-який кіберзлочинець може створити підроблений сайт зі скриптом зняття відбитків пальців.

Нагадаємо, ця стаття — лише перша частина, попереду ще дві. У них розглядаються питання законності збору персональних даних користувачів, можливості використання цих даних та методи захисту проти надто вже активних «збирачів».

Відбиток браузера: що це, як працює, чи порушує закон і як захиститись. Частина 1

Джерело: habr.com