Erabiltzaileen datu-base ezberdinen filtrazioen ondorioz lortutako mila milioi konturen analisia

Argitaratu autentifikazio-parametroekin hainbat datu-baseen filtrazioen ondorioz lortutako mila milioi kontuen bildumaren analisian oinarrituta sortutako estatistikak. Gainera prestatuta pasahitz tipikoen erabilera-maiztasunari buruzko datuekin laginak eta zerrendak 1, 10, 100, 1 eta 10 pasahitz ezagunenetatik, pasahitz hash-en aukeraketa bizkortzeko erabil daitezkeenak.

Orokortze eta aurkikuntza batzuk:

  • Ondorioz, mila milioi erregistroren bildumatik, 257 milioi datu hondatu gisa (formatu okerreko datu kaotikoak) edo proba-kontu gisa baztertu ziren. Iragazki guztien ondoren, 169 milioi pasahitz eta 293 milioi saio-hasiera identifikatu ziren mila milioi erregistrotatik.
  • "123456" pasahitz ezagunena 7 milioi aldiz erabiltzen da (pasahitz guztien % 0.722). Are gehiago atzerapen nabari batekin jarraitu pasahitzak 123456789, pasahitza, qwerty, 12345678.
  • Mila pasahitz ezagunenen kuota pasahitz guztien % 6.607 da, milioi ezagunenen kuota % 36.28 eta 10 milioiren kuota % 54.
  • Pasahitzaren batez besteko tamaina 9.4822 karakterekoa da.
  • Pasahitzen % 12.04k karaktere bereziak dituzte.
  • Pasahitzen % 28.79 letrek soilik osatzen dute.
  • Pasahitzen % 26.16ak minuskulak baino ez ditu sartzen.
  • Pasahitzen % 13.37 zenbakiek soilik osatzen dute.
  • Pasahitzen % 34.41 zenbakiekin amaitzen da, baina pasahitzen % 4.522 soilik zenbaki batekin hasten da.
  • Pasahitzen % 8.83 bakarrik dira bakarrak, gainerakoak bi aldiz edo gehiagotan gertatzen dira. Pasahitz esklusibo baten batez besteko luzera 9.7965 karaktere da. Pasahitz horietako batzuk bakarrik karaktere multzo kaotiko bat dira, esanahirik gabekoak, eta % 7.082k bakarrik ditu karaktere bereziak. Pasahitz esklusiboen % 20.02 hizkiz soilik osatuta dago eta % 15.02 minuskulaz soilik, batez beste 9.36 karaktereko luzera dute.
  • Finkoa set estiloan antzekoak (10 karaktere, zenbakien ausazko konbinazioa, letra larriak eta minuskulak, karaktere berezirik ez, letra larriak hasieran eta amaieran) eta berrerabilitako kalitate handiko eta entropia handiko pasahitzak. Berrerabilpen-tasa nahiko baxua zen (pasahitz horietako batzuk 10 aldiz errepikatu ziren), baina maila honetako pasahitzetan espero baino handiagoa.

Iturria: opennet.ru

Gehitu iruzkin berria