การระบุผู้ใช้โดยประวัติการเข้าชมในเบราว์เซอร์

พนักงานมอซิลลา การตีพิมพ์ ผลการศึกษาความเป็นไปได้ในการระบุผู้ใช้ตามโปรไฟล์การเข้าชมในเบราว์เซอร์ ซึ่งอาจปรากฏแก่บุคคลที่สามและเว็บไซต์ การวิเคราะห์โปรไฟล์การสืบค้น 52 โปรไฟล์ที่จัดทำโดยผู้ใช้ Firefox ที่เข้าร่วมในการทดลองแสดงให้เห็นว่าการตั้งค่าในการเยี่ยมชมไซต์นั้นเป็นลักษณะเฉพาะของผู้ใช้แต่ละคนและคงที่ ความเป็นเอกลักษณ์ของโปรไฟล์ประวัติการเข้าชมที่ได้รับคือ 99% ในเวลาเดียวกัน โปรไฟล์ในระดับสูงจะมีเอกลักษณ์เฉพาะตัว แม้ว่าเราจะจำกัดตัวอย่างให้เหลือเพียงไซต์ยอดนิยมเพียงร้อยไซต์ก็ตาม

การระบุผู้ใช้โดยประวัติการเข้าชมในเบราว์เซอร์

มีการทดสอบความเป็นไปได้ของการระบุตัวตนซ้ำในระหว่างการทดลองสองสัปดาห์ โดยมีความพยายามที่จะเปรียบเทียบข้อมูลจากการเข้าชมในสัปดาห์แรกกับข้อมูลจากสัปดาห์ที่สอง ปรากฎว่าสามารถระบุตัวผู้ใช้ 50% ที่เข้าชมโดเมนที่แตกต่างกันตั้งแต่ 50 โดเมนขึ้นไปได้อีกครั้ง เมื่อเยี่ยมชมโดเมนที่แตกต่างกัน 150 โดเมนขึ้นไป ความครอบคลุมของการระบุตัวตนซ้ำจะเพิ่มขึ้นเป็น 80% การทดสอบดำเนินการกับตัวอย่างไซต์ 10 แห่งเพื่อจำลองข้อมูลที่ผู้ให้บริการเนื้อหารายใหญ่สามารถรับได้ (เช่น Google สามารถควบคุมการเข้าถึง 9823 แห่งจาก 10000 ไซต์เหล่านี้, Facebook - 7348, Verizon - 5500)

คุณลักษณะนี้ช่วยให้เจ้าของทรัพยากรยอดนิยมรายใหญ่สามารถระบุผู้ใช้ที่มีความน่าจะเป็นสูงได้ ตัวอย่างเช่น Google, Facebook และ Twitter ซึ่งมีวิดเจ็ตโฮสต์อยู่บนไซต์บุคคลที่สาม ในทางทฤษฎีสามารถระบุผู้ใช้ได้ประมาณ 80% อีกครั้ง

การระบุผู้ใช้โดยประวัติการเข้าชมในเบราว์เซอร์

คุณยังสามารถระบุไซต์ที่เปิดก่อนหน้านี้ได้ด้วยวิธีการทางอ้อม เช่น โดยการค้นหาผ่านโดเมนยอดนิยมในโค้ด JavaScript และประเมินความแตกต่างในความล่าช้าเมื่อโหลดทรัพยากร - หากผู้ใช้เปิดไซต์เมื่อเร็ว ๆ นี้ ทรัพยากรจะถูกดึงมาจากเบราว์เซอร์ แคชเกือบจะในทันที ก่อนหน้านี้เพื่อกำหนดหน้าที่เปิดอยู่สามารถนำมาใช้ได้ การประเมินผล การแคชการตั้งค่า HSTS (เมื่อเปิดไซต์ด้วย HSTS คำขอ HTTP จะถูกเปลี่ยนเส้นทางไปยัง HTTPS ทันทีโดยไม่ต้องพยายามเข้าถึง HTTP) และ การวิเคราะห์ สถานะของคุณสมบัติ CSS “เยี่ยมชม”

วิธีการประวัติการเข้าชมที่ใช้ CSS ที่คล้ายกันถูกนำมาใช้ในการศึกษาที่คล้ายกัน ดำเนินการ ตั้งแต่ 2009 ถึง 2011. นักวิจัยรายนี้แสดงให้เห็นความสามารถในการระบุผู้ใช้ 42% เมื่อตรวจสอบ 50 หน้า และ 70% เมื่อตรวจสอบ 500 หน้า การวิจัยมอซิลลา ยืนยัน และชี้แจงข้อสรุปของสิ่งพิมพ์ก่อนหน้านี้ในขณะที่ความแม่นยำในการพิจารณาประวัติการเข้าชมเพิ่มขึ้นอย่างมีนัยสำคัญและความครอบคลุมของโดเมนที่ตรวจสอบเพิ่มขึ้นจาก 6000 เป็น 10000 (โดยรวมแล้วได้รับข้อมูลใน 660000 โดเมน แต่เมื่อประเมินการระบุตัวตน มีการใช้ตัวอย่างโดเมนที่ได้รับความนิยมสูงสุด 10 รายการ)

ที่มา: opennet.ru

เพิ่มความคิดเห็น