ProHoster > Блог > Новини інтернету > Аналіз мільярда облікових записів, отриманих внаслідок різних витоків баз користувачів
Аналіз мільярда облікових записів, отриманих внаслідок різних витоків баз користувачів
Опубліковано статистика , сформована з урахуванням аналізу колекції з мільярда облікових записів, отриманих результаті різних витоків баз даних із параметрами аутентифікації. Також підготовлено вибірки з даними про частоту застосування типових паролів та списки з 1 тис., 10 тис., 100 тис., 1 млн. і 10 млн. найпопулярніших паролів, які можуть використовуватися для прискорення підбору хешів паролів.
Деякі узагальнення та знахідки:
З отриманої колекції мільярд записів 257 млн були відкинуті як пошкоджені дані (хаотичні дані в неправильному форматі) або тестові облікові записи. Після всіх фільтрацій із мільярда записів було виділено 169 млн паролів та 293 млн логінів.
Найпопулярніший пароль "123456" зустрічається близько 7 млн разів (0.722% зі всіх паролів). Далі з помітним відставанням слідують паролі 123456789, password, qwerty, 12345678.
Частка тисячі найпопулярніших паролів становить 6.607% від усіх паролів, частка мільйона найпопулярніших паролів – 36.28%, а 10 млн – 54%.
Середній розмір пароля – 9.4822 символів.
12.04% паролів містять спецсимволи.
28.79% паролів складаються лише з літер.
26.16% паролів включають лише символи в нижньому регістрі.
13.37% паролів складаються лише із цифр.
34.41% паролів закінчуються цифрами, але тільки 4.522% із усіх паролів починаються з цифри.
Унікальними є лише 8.83% паролів, решта зустрічається два і більше разів. Середня довжина унікальний пароль 9.7965 символів. Тільки частина цих паролів представляє хаотичний набір знаків, позбавлений сенсу, і лише 7.082% включають спецсимволи. 20.02% унікальних паролів складаються тільки з літер та 15.02% тільки з літер у нижньому регістрі при середній довжині 9.36 символів.
Зафіксовано набір з якісних паролів з високою ентропією, які були схожі за стилем (10-символів, випадкова комбінація цифр, великих і малих літер, відсутність спецсимволів, великі літери спочатку і наприкінці) і використовувалися повторно. Частота повторного використання була досить низька (деякі з цих паролів повторюються 10 разів), але все ж таки вище, ніж очікувалося для паролів такого рівня.