Dấu vân tay của trình duyệt: nó là gì, hoạt động như thế nào, có vi phạm pháp luật hay không và cách tự bảo vệ mình. Phần 1

Dấu vân tay của trình duyệt: nó là gì, hoạt động như thế nào, có vi phạm pháp luật hay không và cách tự bảo vệ mình. Phần 1
Từ Selectel: bài viết này là bài viết đầu tiên trong loạt bản dịch của một bài viết rất chi tiết về dấu vân tay của trình duyệt và cách thức hoạt động của công nghệ. Đây là tất cả những gì bạn muốn biết nhưng ngại hỏi về chủ đề này.

Dấu vân tay của trình duyệt là gì?

Đây là phương pháp được các trang web và dịch vụ sử dụng để theo dõi khách truy cập. Người dùng được gán một mã định danh duy nhất (dấu vân tay). Nó chứa nhiều thông tin về cài đặt và khả năng của trình duyệt của người dùng, được sử dụng để nhận dạng chúng. Ngoài ra, dấu vân tay của trình duyệt cho phép các trang web theo dõi các mẫu hành vi để sau này xác định người dùng chính xác hơn.

Tính duy nhất gần giống như dấu vân tay thật. Chỉ sau này mới được cảnh sát thu thập để truy tìm nghi phạm tội phạm. Nhưng công nghệ lấy dấu vân tay của trình duyệt không được sử dụng để theo dõi tội phạm. Suy cho cùng, chúng ta không phải là tội phạm ở đây, phải không?

Dấu vân tay của trình duyệt thu thập dữ liệu gì?

Chúng tôi biết rằng một người có thể được theo dõi bằng IP từ những ngày đầu của Internet. Nhưng trong trường hợp này mọi thứ phức tạp hơn nhiều. Dấu vân tay của trình duyệt bao gồm địa chỉ IP, nhưng đây không phải là thông tin quan trọng nhất. Trên thực tế, IP không cần thiết để nhận dạng bạn.

Theo nghiên cứu EFF (Tổ chức Biên giới Điện tử), dấu vân tay của trình duyệt bao gồm:

  • Tác nhân người dùng (không chỉ bao gồm trình duyệt mà còn cả phiên bản hệ điều hành, loại thiết bị, cài đặt ngôn ngữ, thanh công cụ, v.v.).
  • Múi giờ.
  • Độ phân giải màn hình và độ sâu màu.
  • Siêu bánh quy.
  • Cài đặt cookie.
  • Phông chữ hệ thống.
  • Các plugin trình duyệt và phiên bản của chúng.
  • Truy cập nhật ký.

Theo nghiên cứu của EFF, tính duy nhất của dấu vân tay trình duyệt là rất cao. Nếu chúng ta nói về số liệu thống kê, thì chỉ một lần trong 286777 trường hợp xảy ra sự trùng khớp hoàn toàn về dấu vân tay trình duyệt của hai người dùng khác nhau.

Theo thêm một nghiên cứu, độ chính xác nhận dạng người dùng bằng dấu vân tay trình duyệt là 99,24%. Việc thay đổi một trong các tham số của trình duyệt sẽ làm giảm độ chính xác của nhận dạng người dùng chỉ 0,3%. Có các bài kiểm tra dấu vân tay của trình duyệt cho biết lượng thông tin đang được thu thập.

Dấu vân tay của trình duyệt hoạt động như thế nào?

Tại sao có thể thu thập thông tin trình duyệt? Thật đơn giản - trình duyệt của bạn liên lạc với máy chủ web khi bạn yêu cầu địa chỉ trang web. Trong tình huống bình thường, các trang web và dịch vụ chỉ định một mã định danh duy nhất cho người dùng.

Ví dụ, "gh5d443ghjflr123ff556ggf".

Chuỗi chữ cái và số ngẫu nhiên này giúp máy chủ nhận ra bạn, liên kết trình duyệt và các tùy chọn của bạn với bạn. Các hành động bạn thực hiện trực tuyến sẽ được gán gần như cùng một mã.

Vì vậy, nếu bạn đăng nhập vào Twitter, nơi có một số thông tin về bạn, tất cả dữ liệu này sẽ tự động được liên kết với cùng một mã định danh.

Tất nhiên, mã này sẽ không ở bên bạn trong những ngày còn lại. Nếu bạn bắt đầu lướt web từ một thiết bị hoặc trình duyệt khác, rất có thể ID cũng sẽ thay đổi.

Dấu vân tay của trình duyệt: nó là gì, hoạt động như thế nào, có vi phạm pháp luật hay không và cách tự bảo vệ mình. Phần 1

Các trang web thu thập dữ liệu người dùng như thế nào?

Đây là một quy trình hai tầng hoạt động ở cả phía máy chủ và phía máy khách.

Phía máy chủ

Nhật ký truy cập trang web

Trong trường hợp này, chúng ta đang nói về việc thu thập dữ liệu do trình duyệt gửi. Tối thiểu thế này:

  • Giao thức được yêu cầu.
  • URL được yêu cầu.
  • IP của bạn.
  • Người giới thiệu.
  • Đại lý người dùng.

Đề mục

Máy chủ web nhận chúng từ trình duyệt của bạn. Tiêu đề rất quan trọng vì chúng cho phép bạn chắc chắn rằng trang web được yêu cầu hoạt động với trình duyệt của bạn.

Ví dụ: thông tin tiêu đề cho phép trang web biết bạn đang sử dụng máy tính để bàn hay thiết bị di động. Trong trường hợp thứ hai, chuyển hướng sẽ xảy ra với phiên bản được tối ưu hóa cho thiết bị di động. Thật không may, dữ liệu tương tự này sẽ lưu lại trong dấu vân tay của bạn.

Cookie

Mọi thứ đều rõ ràng ở đây. Máy chủ web luôn trao đổi cookie với trình duyệt. Nếu bạn bật cookie trong cài đặt của mình, chúng sẽ được lưu trữ trên thiết bị của bạn và gửi đến máy chủ bất cứ khi nào bạn truy cập trang web mà bạn đã truy cập trước đó.

Cookie giúp bạn lướt web thoải mái hơn nhưng chúng cũng tiết lộ nhiều thông tin hơn về bạn.

Vân tay canvas

Phương pháp này sử dụng phần tử canvas HTML5, phần tử này WebGL cũng sử dụng để hiển thị đồ họa 2D và 3D trong trình duyệt.

Phương pháp này thường buộc trình duyệt xử lý nội dung đồ họa, bao gồm hình ảnh, văn bản hoặc cả hai. Quá trình này là vô hình đối với bạn vì mọi thứ diễn ra ở chế độ nền.

Sau khi quá trình hoàn tất, việc lấy dấu vân tay canvas sẽ biến đồ họa thành một hàm băm, trở thành mã nhận dạng duy nhất mà chúng ta đã nói ở trên.

Phương pháp này cho phép bạn có được thông tin sau về thiết bị của mình:

  • Bộ điều hợp đồ họa.
  • Trình điều khiển bộ điều hợp đồ họa.
  • Bộ xử lý (nếu không có chip đồ họa chuyên dụng).
  • Đã cài đặt phông chữ.

Ghi nhật ký phía khách hàng

Điều này giả định rằng trình duyệt của bạn trao đổi nhiều thông tin nhờ:

Adobe Flash và JavaScript

Theo Câu hỏi thường gặp amIUnique, nếu bạn đã bật JavaScript thì dữ liệu về plugin hoặc thông số phần cứng của bạn sẽ được truyền ra bên ngoài.

Nếu Flash được cài đặt và kích hoạt, điều này sẽ cung cấp cho người quan sát bên thứ ba nhiều thông tin hơn nữa, bao gồm:

  • Múi giờ của bạn.
  • Phiên bản của hệ điều hành.
  • Độ phân giải màn hình.
  • Danh sách đầy đủ các phông chữ được cài đặt trên hệ thống.

Cookie

Họ đóng một vai trò rất quan trọng trong việc đăng nhập. Vì vậy, bạn thường cần phải quyết định xem nên cho phép trình duyệt xử lý cookie hay xóa chúng hoàn toàn.

Trong trường hợp đầu tiên, máy chủ web chỉ nhận được một lượng thông tin khổng lồ về thiết bị và tùy chọn của bạn. Nếu bạn không chấp nhận cookie, các trang web vẫn sẽ nhận được một số thông tin về trình duyệt của bạn.

Tại sao cần lấy dấu vân tay của trình duyệt?

Chủ yếu là để người dùng thiết bị nhận được một trang web được tối ưu hóa cho thiết bị của mình, bất kể anh ta truy cập Internet từ máy tính bảng hay điện thoại thông minh.

Ngoài ra, công nghệ này còn được sử dụng để quảng cáo. Đây đơn giản là công cụ khai thác dữ liệu hoàn hảo.

Do đó, sau khi nhận được thông tin do máy chủ thu thập, các nhà cung cấp hàng hóa hoặc dịch vụ có thể tạo ra các chiến dịch quảng cáo được nhắm mục tiêu rất tinh vi với tính cá nhân hóa. Độ chính xác của việc nhắm mục tiêu cao hơn nhiều so với việc chỉ sử dụng địa chỉ IP.

Ví dụ: nhà quảng cáo có thể sử dụng dấu vân tay của trình duyệt để lấy danh sách người dùng trang web có độ phân giải màn hình có thể được coi là thấp (ví dụ: 1300*768) đang tìm kiếm màn hình chất lượng cao hơn trong cửa hàng trực tuyến của người bán. Hoặc người dùng chỉ lướt trang web mà không có ý định mua bất cứ thứ gì.

Sau đó, thông tin thu được có thể được sử dụng để nhắm mục tiêu quảng cáo màn hình chất lượng cao, độ phân giải cao tới người dùng có màn hình nhỏ và lỗi thời.

Ngoài ra, công nghệ lấy dấu vân tay trình duyệt còn được sử dụng để:

  • Phát hiện gian lận và botnet. Đây thực sự là một chức năng hữu ích đối với các ngân hàng và tổ chức tài chính. Chúng cho phép bạn tách hành vi của người dùng khỏi hoạt động của kẻ tấn công.
  • Định nghĩa về người dùng VPN và proxy. Các cơ quan tình báo có thể sử dụng phương pháp này để theo dõi người dùng Internet bằng địa chỉ IP ẩn.

Dấu vân tay của trình duyệt: nó là gì, hoạt động như thế nào, có vi phạm pháp luật hay không và cách tự bảo vệ mình. Phần 1
Cuối cùng, ngay cả khi dấu vân tay của trình duyệt được sử dụng cho mục đích hợp pháp, nó vẫn rất có hại cho quyền riêng tư của người dùng. Đặc biệt nếu những người sau đang cố gắng tự bảo vệ mình bằng VPN.

Ngoài ra, dấu vân tay của trình duyệt có thể là người bạn tốt nhất của hacker. Nếu họ biết chi tiết chính xác về thiết bị của bạn, họ có thể sử dụng các cách khai thác đặc biệt để hack thiết bị. Không có gì phức tạp về điều này - bất kỳ tội phạm mạng nào cũng có thể tạo một trang web giả mạo bằng tập lệnh lấy dấu vân tay.

Hãy để chúng tôi nhắc bạn rằng bài viết này chỉ là phần đầu tiên, còn hai phần nữa sẽ đến. Chúng đề cập đến tính hợp pháp của việc thu thập dữ liệu cá nhân từ người dùng, khả năng sử dụng dữ liệu này và các phương pháp bảo vệ chống lại những “người thu thập” hoạt động quá mức.

Dấu vân tay của trình duyệt: nó là gì, hoạt động như thế nào, có vi phạm pháp luật hay không và cách tự bảo vệ mình. Phần 1

Nguồn: www.habr.com