Analiza miliarda kont uzyskanych w wyniku różnych wycieków baz danych użytkowników
Opublikowany statystyki generowane na podstawie analizy zbioru miliardów kont uzyskanych w wyniku różnych wycieków baz danych z parametrami uwierzytelniającymi. Również przygotowany próbki z danymi na temat częstotliwości używania typowych haseł i listy od 1 tysiąca, 10 tysięcy, 100 tysięcy, 1 miliona i 10 milionów najpopularniejszych haseł, które można wykorzystać do przyspieszenia wyboru skrótów haseł.
Kilka uogólnień i wniosków:
Z powstałej w ten sposób kolekcji miliarda rekordów 257 milionów odrzucono jako dane uszkodzone (dane chaotyczne w złym formacie) lub konta testowe. Po wszystkich filtrach z miliarda rekordów zidentyfikowano 169 milionów haseł i 293 milionów loginów.
Najpopularniejsze hasło „123456” zostało użyte około 7 milionów razy (0.722% wszystkich haseł). Dalej z zauważalnym opóźnieniem śledzić hasła 123456789, hasło, qwerty, 12345678.
Udział tysiąca najpopularniejszych haseł to 6.607% wszystkich haseł, udział miliona najpopularniejszych haseł to 36.28%, a udział 10 milionów to 54%.
Średni rozmiar hasła wynosi 9.4822 znaków.
12.04% haseł zawiera znaki specjalne.
28.79% haseł składa się wyłącznie z liter.
26.16% haseł zawiera wyłącznie małe litery.
13.37% haseł składa się wyłącznie z cyfr.
34.41% haseł kończy się cyframi, ale tylko 4.522% wszystkich haseł zaczyna się od cyfry.
Tylko 8.83% haseł jest unikalnych, reszta występuje dwa lub więcej razy. Średnia długość unikalnego hasła wynosi 9.7965 znaków. Tylko część z tych haseł to chaotyczny zbiór znaków pozbawiony znaczenia, a tylko 7.082% zawiera znaki specjalne. 20.02% unikalnych haseł składa się wyłącznie z liter, a 15.02% wyłącznie z małych liter, a ich średnia długość wynosi 9.36 znaku.
Naprawił zestaw wysokiej jakości haseł o wysokiej entropii, o podobnym stylu (10 znaków, losowa kombinacja cyfr, wielkie i małe litery, bez znaków specjalnych, wielkie litery na początku i na końcu) i ponownie wykorzystywanych. Wskaźnik ponownego użycia był dość niski (niektóre z tych haseł zostały powtórzone 10 razy), ale nadal wyższy niż oczekiwano w przypadku haseł tego poziomu.