Análise de um bilhão de contas obtidas como resultado de vários vazamentos de bancos de dados de usuários

Publicado estatísticas geradas com base na análise de um acervo de um bilhão de contas obtidas em decorrência de diversos vazamentos de bancos de dados com parâmetros de autenticação. Também preparado amostras com dados sobre a frequência de uso de senhas típicas e listas de 1 mil, 10 mil, 100 mil, 1 milhão e 10 milhões de senhas mais populares, que podem ser usadas para agilizar a seleção de hashes de senhas.

Algumas generalizações e descobertas:

  • Da coleção resultante de um bilhão de registros, 257 milhões foram descartados como dados corrompidos (dados caóticos no formato errado) ou contas de teste. Após toda a filtragem, foram identificados 169 milhões de senhas e 293 milhões de logins em um bilhão de registros.
  • A senha mais popular “123456” é usada cerca de 7 milhões de vezes (0.722% de todas as senhas). Além disso, com um atraso perceptível Segue senhas 123456789, senha, qwerty, 12345678.
  • A parcela das mil senhas mais populares é de 6.607% de todas as senhas, a parcela do milhão de senhas mais populares é de 36.28% e a parcela de 10 milhões é de 54%.
  • O tamanho médio da senha é de 9.4822 caracteres.
  • 12.04% das senhas contêm caracteres especiais.
  • 28.79% das senhas consistem apenas em letras.
  • 26.16% das senhas incluem apenas caracteres minúsculos.
  • 13.37% das senhas consistem apenas em números.
  • 34.41% das senhas terminam com números, mas apenas 4.522% de todas as senhas começam com números.
  • Apenas 8.83% das senhas são únicas, o restante ocorre duas ou mais vezes. O comprimento médio de uma senha exclusiva é de 9.7965 caracteres. Apenas algumas dessas senhas são um conjunto caótico de caracteres, desprovidos de significado, e apenas 7.082% incluem caracteres especiais. 20.02% das senhas únicas são compostas apenas por letras e 15.02% apenas por letras minúsculas, com comprimento médio de 9.36 caracteres.
  • Fixo conjunto de senhas de alta qualidade e alta entropia, com estilo semelhante (10 caracteres, combinação aleatória de números, letras maiúsculas e minúsculas, sem caracteres especiais, letras maiúsculas no início e no final) e reutilizadas. A taxa de reutilização foi bastante baixa (algumas destas senhas foram repetidas 10 vezes), mas ainda superior ao esperado para senhas deste nível.

Fonte: opennet.ru

Adicionar um comentário