對因各種用戶資料庫外洩而獲得的十億個帳戶進行分析

發表 基於對由於各種資料庫洩漏和身份驗證參數而獲得的十億帳戶集合的分析而產生的統計數據。 還 準備好了 包含典型密碼使用頻率資料的樣本以及 列表 從 1、10、100、1 萬和 10 萬個最受歡迎的密碼中選擇,可用於加快密碼雜湊的選擇。

一些概括與發現:

  • 在最終收集的 257 億筆記錄中,有 169 億筆作為損壞資料(格式錯誤的混亂資料)或測試帳戶而被丟棄。 經過所有過濾後,從 293 億筆記錄中識別出 XNUMX 億個密碼和 XNUMX 億個登入資訊。
  • 最常用的密碼「123456」的使用次數約為 7 萬次(佔所有密碼的 0.722%)。 進一步有明顯的滯後 跟隨 密碼 123456789,密碼,qwerty,12345678。
  • 千熱門密碼佔比為6.607%,百萬熱門密碼比為36.28%,千萬密碼佔比為10%。
  • 平均密碼大小為 9.4822 個字元。
  • 12.04% 的密碼包含特殊字元。
  • 28.79% 的密碼僅由字母組成。
  • 26.16% 的密碼僅包含小寫字元。
  • 13.37% 的密碼僅由數字組成。
  • 34.41% 的密碼以數字結尾,但只有 4.522% 的密碼以數字開頭。
  • 只有 8.83% 的密碼是唯一的,其餘的密碼出現兩次或多次。 唯一密碼的平均長度為 9.7965 個字元。 這些密碼中只有一些是混亂的字元集,沒有任何意義,並且只有 7.082% 包含特殊字元。 20.02% 的唯一密碼僅由字母組成,15.02% 僅由小寫字母組成,平均長度為 9.36 個字元。
  • 固定的 風格相似(10個字符,數字隨機組合,大小寫字母,無特殊字符,開頭和結尾字母大寫)並重複使用的高質量、高熵密碼。 重用率相當低(其中一些密碼重複了 10 次),但仍高於該等級密碼的預期。

來源: opennet.ru

添加評論