ProHoster > Blog > noticias de internet > Análise de mil millóns de contas obtidas como resultado de varias fugas de bases de datos de usuarios
Análise de mil millóns de contas obtidas como resultado de varias fugas de bases de datos de usuarios
Publicado estatísticas xeradas a partir da análise dunha colección de mil millóns de contas obtidas como consecuencia de varias fugas de bases de datos con parámetros de autenticación. Tamén preparado mostras con datos sobre a frecuencia de uso de contrasinais típicos e as listas de 1 mil, 10 mil, 100 mil, 1 millón e 10 millóns de contrasinais máis populares, que se poden usar para acelerar a selección de hash de contrasinais.
Algunhas xeneralizacións e conclusións:
Da colección resultante de mil millóns de rexistros, 257 millóns descartáronse como datos corruptos (datos caóticos nun formato incorrecto) ou contas de proba. Despois de todo o filtrado, identificáronse 169 millóns de contrasinais e 293 millóns de inicios de sesión entre mil millóns de rexistros.
O contrasinal máis popular "123456" úsase uns 7 millóns de veces (0.722% de todos os contrasinais). Ademais cun notable desfase seguir contrasinais 123456789, contrasinal, qwerty, 12345678.
A participación dos mil contrasinais máis populares é do 6.607% de todas as contrasinais, a cota do millón de contrasinais máis populares é do 36.28% e a cota de 10 millóns é do 54%.
O tamaño medio do contrasinal é de 9.4822 caracteres.
O 12.04% dos contrasinais conteñen caracteres especiais.
O 28.79% dos contrasinais só consisten en letras.
O 26.16% dos contrasinais inclúe só caracteres en minúscula.
O 13.37% dos contrasinais consisten só en números.
O 34.41% dos contrasinais rematan con números, pero só o 4.522% de todos os contrasinais comezan por un número.
Só o 8.83% dos contrasinais son únicos, o resto ocorre dúas ou máis veces. A lonxitude media dun contrasinal único é de 9.7965 caracteres. Só algúns destes contrasinais son un conxunto caótico de caracteres, carentes de significado, e só o 7.082% inclúe caracteres especiais. O 20.02% dos contrasinais únicos consisten só en letras e o 15.02% só en minúsculas, cunha lonxitude media de 9.36 caracteres.
Fixo conxunto de contrasinais de alta calidade e alta entropía que tiñan un estilo similar (10 caracteres, combinación aleatoria de números, letras maiúsculas e minúsculas, sen caracteres especiais, letras maiúsculas ao principio e ao final) e reutilizadas. A taxa de reutilización foi bastante baixa (algúns destes contrasinais repetíronse 10 veces), pero aínda máis do esperado para os contrasinais deste nivel.