Ανάλυση ενός δισεκατομμυρίου λογαριασμών που ελήφθησαν ως αποτέλεσμα διαρροών διαφόρων βάσεων δεδομένων χρηστών

Δημοσίευσε στατιστικά στοιχεία που παράγονται με βάση την ανάλυση μιας συλλογής ενός δισεκατομμυρίου λογαριασμών που ελήφθησαν ως αποτέλεσμα διάφορων διαρροών βάσης δεδομένων με παραμέτρους ελέγχου ταυτότητας. Επίσης έτοιμος δείγματα με δεδομένα για τη συχνότητα χρήσης τυπικών κωδικών πρόσβασης και τις λίστες από 1 χιλιάδες, 10 χιλιάδες, 100 χιλιάδες, 1 εκατομμύριο και 10 εκατομμύρια πιο δημοφιλείς κωδικούς πρόσβασης, οι οποίοι μπορούν να χρησιμοποιηθούν για την επιτάχυνση της επιλογής κατακερματισμού κωδικών πρόσβασης.

Μερικές γενικεύσεις και ευρήματα:

  • Από τη συλλογή ενός δισεκατομμυρίου εγγραφών που προέκυψε, 257 εκατομμύρια απορρίφθηκαν ως κατεστραμμένα δεδομένα (χαοτικά δεδομένα σε λάθος μορφή) ή δοκιμαστικοί λογαριασμοί. Μετά από όλο το φιλτράρισμα, 169 εκατομμύρια κωδικοί πρόσβασης και 293 εκατομμύρια συνδέσεις εντοπίστηκαν από ένα δισεκατομμύριο εγγραφές.
  • Ο πιο δημοφιλής κωδικός «123456» χρησιμοποιείται περίπου 7 εκατομμύρια φορές (0.722% όλων των κωδικών πρόσβασης). Περαιτέρω με αισθητή υστέρηση ακολουθηστε κωδικοί πρόσβασης 123456789, κωδικός πρόσβασης, qwerty, 12345678.
  • Το μερίδιο των χιλίων πιο δημοφιλών κωδικών πρόσβασης είναι 6.607% όλων των κωδικών πρόσβασης, το μερίδιο των εκατομμυρίων πιο δημοφιλών κωδικών πρόσβασης είναι 36.28% και το μερίδιο των 10 εκατομμυρίων είναι 54%.
  • Το μέσο μέγεθος κωδικού πρόσβασης είναι 9.4822 χαρακτήρες.
  • Το 12.04% των κωδικών πρόσβασης περιέχουν ειδικούς χαρακτήρες.
  • Το 28.79% των κωδικών πρόσβασης αποτελείται μόνο από γράμματα.
  • Το 26.16% των κωδικών πρόσβασης περιλαμβάνουν μόνο πεζούς χαρακτήρες.
  • Το 13.37% των κωδικών πρόσβασης αποτελείται μόνο από αριθμούς.
  • Το 34.41% των κωδικών πρόσβασης τελειώνουν με αριθμούς, αλλά μόνο το 4.522% όλων των κωδικών πρόσβασης ξεκινούν με έναν αριθμό.
  • Μόνο το 8.83% των κωδικών πρόσβασης είναι μοναδικοί, ενώ οι υπόλοιποι εμφανίζονται δύο ή περισσότερες φορές. Το μέσο μήκος ενός μοναδικού κωδικού πρόσβασης είναι 9.7965 χαρακτήρες. Μόνο ορισμένοι από αυτούς τους κωδικούς πρόσβασης είναι ένα χαοτικό σύνολο χαρακτήρων, χωρίς νόημα, και μόνο το 7.082% περιλαμβάνει ειδικούς χαρακτήρες. Το 20.02% των μοναδικών κωδικών πρόσβασης αποτελούνται μόνο από γράμματα και το 15.02% μόνο από πεζά γράμματα, με μέσο μήκος 9.36 χαρακτήρες.
  • Σταθερός σετ κωδικών πρόσβασης υψηλής ποιότητας, υψηλής εντροπίας που είχαν παρόμοιο στυλ (10 χαρακτήρες, τυχαίος συνδυασμός αριθμών, κεφαλαία και πεζά γράμματα, χωρίς ειδικούς χαρακτήρες, κεφαλαία γράμματα στην αρχή και στο τέλος) και επαναχρησιμοποιήθηκαν. Το ποσοστό επαναχρησιμοποίησης ήταν αρκετά χαμηλό (μερικοί από αυτούς τους κωδικούς πρόσβασης επαναλήφθηκαν 10 φορές), αλλά και πάλι υψηλότερος από το αναμενόμενο για κωδικούς πρόσβασης αυτού του επιπέδου.

Πηγή: opennet.ru

Προσθέστε ένα σχόλιο