Analisis satu bilion akaun yang diperoleh hasil daripada pelbagai kebocoran pangkalan data pengguna

Diterbitkan statistik yang dihasilkan berdasarkan analisis koleksi satu bilion akaun yang diperoleh hasil daripada pelbagai kebocoran pangkalan data dengan parameter pengesahan. Juga disediakan sampel dengan data tentang kekerapan penggunaan kata laluan biasa dan senarai daripada 1 ribu, 10 ribu, 100 ribu, 1 juta dan 10 juta kata laluan paling popular, yang boleh digunakan untuk mempercepatkan pemilihan cincang kata laluan.

Beberapa generalisasi dan penemuan:

  • Daripada pengumpulan satu bilion rekod yang terhasil, 257 juta telah dibuang sebagai data yang rosak (data huru-hara dalam format yang salah) atau akaun ujian. Selepas semua penapisan, 169 juta kata laluan dan 293 juta log masuk dikenal pasti daripada satu bilion rekod.
  • Kata laluan paling popular "123456" digunakan kira-kira 7 juta kali (0.722% daripada semua kata laluan). Selanjutnya dengan ketinggalan yang ketara ikut kata laluan 123456789, kata laluan, qwerty, 12345678.
  • Bahagian seribu kata laluan paling popular ialah 6.607% daripada semua kata laluan, bahagian juta kata laluan paling popular ialah 36.28%, dan bahagian 10 juta ialah 54%.
  • Saiz kata laluan purata ialah 9.4822 aksara.
  • 12.04% kata laluan mengandungi aksara khas.
  • 28.79% kata laluan terdiri daripada huruf sahaja.
  • 26.16% kata laluan hanya mengandungi aksara kecil.
  • 13.37% kata laluan hanya terdiri daripada nombor.
  • 34.41% kata laluan berakhir dengan nombor, tetapi hanya 4.522% daripada semua kata laluan bermula dengan nombor.
  • Hanya 8.83% kata laluan adalah unik, selebihnya berlaku dua kali atau lebih. Purata panjang kata laluan unik ialah 9.7965 aksara. Hanya sebahagian daripada kata laluan ini adalah set aksara yang huru-hara, tanpa makna, dan hanya 7.082% termasuk aksara khas. 20.02% kata laluan unik hanya terdiri daripada huruf dan 15.02% hanya huruf kecil, dengan purata panjang 9.36 aksara.
  • tetap ditetapkan kata laluan berkualiti tinggi, entropi tinggi yang serupa dalam gaya (10 aksara, gabungan nombor rawak, huruf besar dan kecil, tiada aksara khas, huruf besar pada permulaan dan akhir) dan digunakan semula. Kadar penggunaan semula agak rendah (sesetengah kata laluan ini diulang 10 kali), tetapi masih lebih tinggi daripada yang dijangkakan untuk kata laluan tahap ini.

Sumber: opennet.ru

Tambah komen