Analiza miliarda kont uzyskanych w wyniku różnych wycieków baz danych użytkowników

Opublikowany statystyki generowane na podstawie analizy zbioru miliardów kont uzyskanych w wyniku różnych wycieków baz danych z parametrami uwierzytelniającymi. Również przygotowany próbki z danymi na temat częstotliwości używania typowych haseł i listy od 1 tysiąca, 10 tysięcy, 100 tysięcy, 1 miliona i 10 milionów najpopularniejszych haseł, które można wykorzystać do przyspieszenia wyboru skrótów haseł.

Kilka uogólnień i wniosków:

  • Z powstałej w ten sposób kolekcji miliarda rekordów 257 milionów odrzucono jako dane uszkodzone (dane chaotyczne w złym formacie) lub konta testowe. Po wszystkich filtrach z miliarda rekordów zidentyfikowano 169 milionów haseł i 293 milionów loginów.
  • Najpopularniejsze hasło „123456” zostało użyte około 7 milionów razy (0.722% wszystkich haseł). Dalej z zauważalnym opóźnieniem śledzić hasła 123456789, hasło, qwerty, 12345678.
  • Udział tysiąca najpopularniejszych haseł to 6.607% wszystkich haseł, udział miliona najpopularniejszych haseł to 36.28%, a udział 10 milionów to 54%.
  • Średni rozmiar hasła wynosi 9.4822 znaków.
  • 12.04% haseł zawiera znaki specjalne.
  • 28.79% haseł składa się wyłącznie z liter.
  • 26.16% haseł zawiera wyłącznie małe litery.
  • 13.37% haseł składa się wyłącznie z cyfr.
  • 34.41% haseł kończy się cyframi, ale tylko 4.522% wszystkich haseł zaczyna się od cyfry.
  • Tylko 8.83% haseł jest unikalnych, reszta występuje dwa lub więcej razy. Średnia długość unikalnego hasła wynosi 9.7965 znaków. Tylko część z tych haseł to chaotyczny zbiór znaków pozbawiony znaczenia, a tylko 7.082% zawiera znaki specjalne. 20.02% unikalnych haseł składa się wyłącznie z liter, a 15.02% wyłącznie z małych liter, a ich średnia długość wynosi 9.36 znaku.
  • Naprawił zestaw wysokiej jakości haseł o wysokiej entropii, o podobnym stylu (10 znaków, losowa kombinacja cyfr, wielkie i małe litery, bez znaków specjalnych, wielkie litery na początku i na końcu) i ponownie wykorzystywanych. Wskaźnik ponownego użycia był dość niski (niektóre z tych haseł zostały powtórzone 10 razy), ale nadal wyższy niż oczekiwano w przypadku haseł tego poziomu.

Źródło: opennet.ru

Dodaj komentarz