Analyse av en milliard kontoer oppnådd som følge av ulike brukerdatabaselekkasjer

Publisert statistikk generert basert på analysen av en samling på en milliard kontoer oppnådd som et resultat av ulike databaselekkasjer med autentiseringsparametere. Også forberedt prøver med data om hyppigheten av bruk av typiske passord og listene fra 1 tusen, 10 tusen, 100 tusen, 1 million og 10 millioner mest populære passord, som kan brukes til å fremskynde valg av passordhasher.

Noen generaliseringer og funn:

  • Av den resulterende innsamlingen av en milliard poster ble 257 millioner forkastet som korrupte data (kaotiske data i feil format) eller testkontoer. Etter all filtreringen ble 169 millioner passord og 293 millioner pålogginger identifisert fra en milliard poster.
  • Det mest populære passordet "123456" brukes omtrent 7 millioner ganger (0.722 % av alle passord). Videre med et merkbart etterslep Følg passord 123456789, passord, qwerty, 12345678.
  • Andelen av de tusen mest populære passordene er 6.607 % av alle passord, andelen av de millioner mest populære passordene er 36.28 %, og andelen 10 millioner er 54 %.
  • Den gjennomsnittlige passordstørrelsen er 9.4822 tegn.
  • 12.04 % av passordene inneholder spesialtegn.
  • 28.79 % av passordene består kun av bokstaver.
  • 26.16 % av passordene inneholder bare små bokstaver.
  • 13.37 % av passordene består kun av tall.
  • 34.41 % av passordene slutter med tall, men bare 4.522 % av alle passord begynner med et tall.
  • Bare 8.83 % av passordene er unike, resten forekommer to eller flere ganger. Gjennomsnittlig lengde på et unikt passord er 9.7965 tegn. Bare noen av disse passordene er et kaotisk sett med tegn, blottet for mening, og bare 7.082 % inkluderer spesialtegn. 20.02 % av unike passord består kun av bokstaver og 15.02 % kun av små bokstaver, med en gjennomsnittlig lengde på 9.36 tegn.
  • Fikset satt av høy-entropiske passord av høy kvalitet som var like i stilen (10 tegn, tilfeldig kombinasjon av tall, store og små bokstaver, ingen spesialtegn, store bokstaver i begynnelsen og slutten) og gjenbrukt. Gjenbruksfrekvensen var ganske lav (noen av disse passordene ble gjentatt 10 ganger), men fortsatt høyere enn forventet for passord på dette nivået.

Kilde: opennet.ru

Legg til en kommentar