Identifikasi pengguna berdasarkan riwayat penelusuran di browser

Karyawan Mozilla diterbitkan hasil studi tentang kemungkinan mengidentifikasi pengguna berdasarkan profil kunjungan di browser, yang mungkin dapat dilihat oleh pihak ketiga dan situs web. Analisis terhadap 52 ribu profil penjelajahan yang disediakan oleh pengguna Firefox yang mengikuti percobaan menunjukkan bahwa preferensi dalam mengunjungi situs merupakan karakteristik setiap pengguna dan bersifat konstan. Keunikan profil riwayat penelusuran yang diperoleh adalah 99%. Pada saat yang sama, tingkat keunikan profil yang tinggi tetap terjaga meskipun kami membatasi sampel hanya pada seratus situs populer.

Identifikasi pengguna berdasarkan riwayat penelusuran di browser

Kemungkinan identifikasi ulang diuji selama percobaan dua minggu - upaya dilakukan untuk membandingkan data kunjungan pada minggu pertama dengan data dari minggu kedua. Ternyata 50% pengguna yang mengunjungi 50 atau lebih domain berbeda dapat diidentifikasi ulang. Saat mengunjungi 150 atau lebih domain berbeda, cakupan identifikasi ulang meningkat menjadi 80%. Pengujian dilakukan pada sampel 10 situs untuk mensimulasikan data yang dapat diperoleh penyedia konten besar (misalnya, Google dapat mengontrol akses ke 9823 dari 10000 situs ini, Facebook - 7348, Verizon - 5500).

Fitur ini memungkinkan pemilik besar sumber daya populer untuk mengidentifikasi pengguna dengan probabilitas yang cukup tinggi. Misalnya, Google, Facebook, dan Twitter, yang widgetnya dihosting di situs pihak ketiga, secara teoritis dapat mengidentifikasi ulang sekitar 80% pengguna.

Identifikasi pengguna berdasarkan riwayat penelusuran di browser

Anda juga dapat menentukan situs yang dibuka sebelumnya dengan metode tidak langsung, misalnya, dengan menelusuri domain populer dalam kode JavaScript dan menilai perbedaan penundaan saat memuat sumber daya - jika situs baru saja dibuka oleh pengguna, sumber daya akan diambil dari browser cache hampir seketika. Sebelumnya, untuk menentukan halaman terbuka bisa digunakan оценка menyimpan pengaturan HSTS (saat membuka situs dengan HSTS, permintaan HTTP segera dialihkan ke HTTPS tanpa mencoba mengakses HTTP) dan analisis keadaan properti CSS "dikunjungi".

Metode riwayat penelusuran berbasis CSS serupa digunakan dalam penelitian serupa, dilakukan dari tahun 2009 hingga tahun 2011. Peneliti ini menunjukkan kemampuan mengidentifikasi 42% pengguna saat memeriksa 50 halaman dan 70% saat memeriksa 500 halaman. Penelitian Mozilla dikonfirmasi dan memperjelas kesimpulan dari publikasi sebelumnya, sementara keakuratan menentukan riwayat penelusuran meningkat secara signifikan, dan cakupan domain yang diperiksa ditingkatkan dari 6000 menjadi 10000 (secara total, data diperoleh pada 660000 domain, tetapi saat menilai identifikasi, a sampel 10 ribu domain paling populer digunakan).

Sumber: opennet.ru

Tambah komentar