Analiza e një miliard llogarive të marra si rezultat i rrjedhjeve të ndryshme të bazës së të dhënave të përdoruesve

Publikuar statistikat e krijuara bazuar në analizën e një koleksioni prej një miliard llogarish të marra si rezultat i rrjedhjeve të ndryshme të bazës së të dhënave me parametra vërtetimi. Gjithashtu përgatitur mostra me të dhëna për shpeshtësinë e përdorimit të fjalëkalimeve tipike dhe listat nga 1 mijë, 10 mijë, 100 mijë, 1 milion dhe 10 milion fjalëkalimet më të njohura, të cilat mund të përdoren për të përshpejtuar zgjedhjen e hasheve të fjalëkalimeve.

Disa përgjithësime dhe gjetje:

  • Nga koleksioni rezultues i një miliard regjistrimesh, 257 milionë u hodhën poshtë si të dhëna të korruptuara (të dhëna kaotike në formatin e gabuar) ose llogari testimi. Pas gjithë filtrimit, 169 milionë fjalëkalime dhe 293 milionë hyrje u identifikuan nga një miliard regjistrime.
  • Fjalëkalimi më i popullarizuar "123456" përdoret rreth 7 milion herë (0.722% e të gjithë fjalëkalimeve). Më tej me një vonesë të dukshme ndjekin fjalëkalimet 123456789, fjalëkalimi, qwerty, 12345678.
  • Pjesa e mijëra fjalëkalimeve më të njohura është 6.607% e të gjitha fjalëkalimeve, pjesa e miliona fjalëkalimeve më të njohura është 36.28%, dhe pjesa prej 10 milionë është 54%.
  • Madhësia mesatare e fjalëkalimit është 9.4822 karaktere.
  • 12.04% e fjalëkalimeve përmbajnë karaktere speciale.
  • 28.79% e fjalëkalimeve përbëhen vetëm nga shkronja.
  • 26.16% e fjalëkalimeve përfshijnë vetëm shkronja të vogla.
  • 13.37% e fjalëkalimeve përbëhen vetëm nga numra.
  • 34.41% e fjalëkalimeve përfundojnë me numra, por vetëm 4.522% e të gjitha fjalëkalimeve fillojnë me një numër.
  • Vetëm 8.83% e fjalëkalimeve janë unike, pjesa tjetër ndodh dy ose më shumë herë. Gjatësia mesatare e një fjalëkalimi unik është 9.7965 karaktere. Vetëm disa nga këto fjalëkalime janë një grup kaotik karakteresh, pa kuptim, dhe vetëm 7.082% përfshijnë karaktere speciale. 20.02% e fjalëkalimeve unike përbëhen vetëm nga shkronja dhe 15.02% vetëm nga shkronja të vogla, me një gjatësi mesatare prej 9.36 karaktere.
  • E rregulluar i vendosur fjalëkalime me cilësi të lartë, me entropi të lartë që ishin të ngjashëm në stil (10 karaktere, kombinim i rastësishëm i numrave, shkronja të mëdha dhe të vogla, pa karaktere të veçanta, shkronja të mëdha në fillim dhe në fund) dhe të ripërdorura. Shkalla e ripërdorimit ishte mjaft e ulët (disa nga këto fjalëkalime u përsëritën 10 herë), por gjithsesi më e lartë se sa pritej për fjalëkalimet e këtij niveli.

Burimi: opennet.ru

Shto një koment