Erilaisten käyttäjätietokantojen vuotojen seurauksena saadun miljardin tilin analyysi

Julkaistu tilastot, jotka on luotu erilaisten todennusparametrien tietokantavuotojen seurauksena saadun miljardin tilin kokoelman analyysin perusteella. Myös valmis näytteitä, joissa on tietoja tyypillisten salasanojen käyttötiheydestä ja luettelot 1, 10, 100, 1 ja 10 suosituin salasana, joilla voidaan nopeuttaa salasanahajautusten valintaa.

Muutamia yleistyksiä ja havaintoja:

  • Tuloksena syntyneestä miljardin tietueen kokoelmasta 257 miljoonaa hylättiin vioittuneena datana (kaaoottinen data väärässä muodossa) tai testitilejä. Kaiken suodatuksen jälkeen miljardista tietueesta tunnistettiin 169 miljoonaa salasanaa ja 293 miljoonaa kirjautumista.
  • Suosituinta salasanaa ”123456” käytetään noin 7 miljoonaa kertaa (0.722 % kaikista salasanoista). Lisäksi huomattavalla viiveellä seuraa salasanat 123456789, salasana, qwerty, 12345678.
  • Tuhannen suosituimman salasanan osuus on 6.607 % kaikista salasanoista, miljoonan suosituimman salasanan osuus on 36.28 % ja 10 miljoonan 54 %.
  • Keskimääräinen salasanan koko on 9.4822 merkkiä.
  • 12.04 % salasanoista sisältää erikoismerkkejä.
  • 28.79 % salasanoista koostuu vain kirjaimista.
  • 26.16 % salasanoista sisältää vain pieniä kirjaimia.
  • 13.37 % salasanoista koostuu vain numeroista.
  • 34.41 % salasanoista päättyy numeroihin, mutta vain 4.522 % kaikista salasanoista alkaa numerolla.
  • Vain 8.83 % salasanoista on ainutlaatuisia, loput esiintyvät vähintään kaksi kertaa. Yksilöllisen salasanan keskimääräinen pituus on 9.7965 merkkiä. Vain osa näistä salasanoista on kaoottinen merkkijoukko, jolla ei ole merkitystä, ja vain 7.082 % sisältää erikoismerkkejä. Yksilöllisistä salasanoista 20.02 % koostuu vain kirjaimista ja 15.02 % vain pienistä kirjaimista, joiden keskimääräinen pituus on 9.36 merkkiä.
  • Korjattu setti korkealaatuisia, entropiaa sisältäviä salasanoja, jotka olivat tyyliltään samanlaisia ​​(10 merkkiä, satunnainen numeroyhdistelmä, isot ja pienet kirjaimet, ei erikoismerkkejä, isot kirjaimet alussa ja lopussa) ja käytetty uudelleen. Uudelleenkäyttöaste oli melko alhainen (jotkin näistä salasanoista toistettiin 10 kertaa), mutta silti suurempi kuin tämän tason salasanojen odotettiin.

Lähde: opennet.ru

Lisää kommentti