Análise de mil millóns de contas obtidas como resultado de varias fugas de bases de datos de usuarios

Publicado estatísticas xeradas a partir da análise dunha colección de mil millóns de contas obtidas como consecuencia de varias fugas de bases de datos con parámetros de autenticación. Tamén preparado mostras con datos sobre a frecuencia de uso de contrasinais típicos e as listas de 1 mil, 10 mil, 100 mil, 1 millón e 10 millóns de contrasinais máis populares, que se poden usar para acelerar a selección de hash de contrasinais.

Algunhas xeneralizacións e conclusións:

  • Da colección resultante de mil millóns de rexistros, 257 millóns descartáronse como datos corruptos (datos caóticos nun formato incorrecto) ou contas de proba. Despois de todo o filtrado, identificáronse 169 millóns de contrasinais e 293 millóns de inicios de sesión entre mil millóns de rexistros.
  • O contrasinal máis popular "123456" úsase uns 7 millóns de veces (0.722% de todos os contrasinais). Ademais cun notable desfase seguir contrasinais 123456789, contrasinal, qwerty, 12345678.
  • A participación dos mil contrasinais máis populares é do 6.607% de todas as contrasinais, a cota do millón de contrasinais máis populares é do 36.28% e a cota de 10 millóns é do 54%.
  • O tamaño medio do contrasinal é de 9.4822 caracteres.
  • O 12.04% dos contrasinais conteñen caracteres especiais.
  • O 28.79% dos contrasinais só consisten en letras.
  • O 26.16% dos contrasinais inclúe só caracteres en minúscula.
  • O 13.37% dos contrasinais consisten só en números.
  • O 34.41% dos contrasinais rematan con números, pero só o 4.522% de todos os contrasinais comezan por un número.
  • Só o 8.83% dos contrasinais son únicos, o resto ocorre dúas ou máis veces. A lonxitude media dun contrasinal único é de 9.7965 caracteres. Só algúns destes contrasinais son un conxunto caótico de caracteres, carentes de significado, e só o 7.082% inclúe caracteres especiais. O 20.02% dos contrasinais únicos consisten só en letras e o 15.02% só en minúsculas, cunha lonxitude media de 9.36 caracteres.
  • Fixo conxunto de contrasinais de alta calidade e alta entropía que tiñan un estilo similar (10 caracteres, combinación aleatoria de números, letras maiúsculas e minúsculas, sen caracteres especiais, letras maiúsculas ao principio e ao final) e reutilizadas. A taxa de reutilización foi bastante baixa (algúns destes contrasinais repetíronse 10 veces), pero aínda máis do esperado para os contrasinais deste nivel.

Fonte: opennet.ru

Engadir un comentario