Αξιοπιστία μνήμης flash: αναμενόμενη και μη αναμενόμενη. Μέρος 2. XIV συνέδριο της ένωσης USENIX. Τεχνολογίες αποθήκευσης αρχείων

Αξιοπιστία μνήμης flash: αναμενόμενη και μη αναμενόμενη. Μέρος 1. XIV συνέδριο της ένωσης USENIX. Τεχνολογίες αποθήκευσης αρχείων

4.2.2. RBER και ηλικία δίσκου (εξαιρουμένων των κύκλων PE).

Το Σχήμα 1 δείχνει μια σημαντική συσχέτιση μεταξύ του RBER και της ηλικίας, που είναι ο αριθμός των μηνών που ο δίσκος ήταν στο πεδίο. Ωστόσο, αυτός μπορεί να είναι ένας ψεύτικος συσχετισμός, καθώς είναι πιθανό οι παλαιότερες μονάδες δίσκου να έχουν περισσότερα PE και επομένως το RBER συσχετίζεται περισσότερο με τους κύκλους PE.

Για να εξαλείψουμε την επίδραση της ηλικίας στη φθορά που προκαλείται από τους κύκλους PE, ομαδοποιήσαμε όλους τους μήνες υπηρεσίας σε δοχεία χρησιμοποιώντας τις δεκατιανές της κατανομής του κύκλου PE ως διαχωριστικό μεταξύ των δοχείων, για παράδειγμα, το πρώτο δοχείο περιέχει όλους τους μήνες ζωής του δίσκου μέχρι το πρώτη δεκατία της κατανομής του κύκλου PE και ούτω καθεξής Περαιτέρω. Επαληθεύσαμε ότι σε κάθε κοντέινερ η συσχέτιση μεταξύ των κύκλων PE και του RBER είναι αρκετά μικρή (καθώς κάθε κοντέινερ καλύπτει μόνο ένα μικρό εύρος κύκλων PE) και στη συνέχεια υπολογίσαμε τον συντελεστή συσχέτισης μεταξύ RBER και ηλικίας δίσκου ξεχωριστά για κάθε δοχείο.

Πραγματοποιήσαμε αυτήν την ανάλυση ξεχωριστά για κάθε μοντέλο, επειδή τυχόν παρατηρηθείσες συσχετίσεις δεν οφείλονται σε διαφορές μεταξύ των νεότερων και παλαιότερων μοντέλων, αλλά αποκλειστικά λόγω της ηλικίας των μονάδων δίσκου του ίδιου μοντέλου. Παρατηρήσαμε ότι ακόμη και μετά τον περιορισμό της επίδρασης των κύκλων PE με τον τρόπο που περιγράφηκε παραπάνω, για όλα τα μοντέλα κίνησης εξακολουθούσε να υπάρχει σημαντική συσχέτιση μεταξύ του αριθμού των μηνών που είχε μια μονάδα δίσκου στο πεδίο και του RBER (οι συντελεστές συσχέτισης κυμαίνονταν από 0,2 έως 0,4 ).

Αξιοπιστία μνήμης flash: αναμενόμενη και μη αναμενόμενη. Μέρος 2. XIV συνέδριο της ένωσης USENIX. Τεχνολογίες αποθήκευσης αρχείων
Ρύζι. 3. Η σχέση μεταξύ του RBER και του αριθμού των κύκλων PE για νέους και παλιούς δίσκους δείχνει ότι η ηλικία του δίσκου επηρεάζει την τιμή RBER ανεξάρτητα από τους κύκλους PE που προκαλούνται από τη φθορά.

Επίσης, απεικονίσαμε γραφικά την επίδραση της ηλικίας της μονάδας, διαιρώντας τις ημέρες χρήσης της μονάδας σε «νεαρή» ηλικία έως 1 έτους και τις ημέρες χρήσης της μονάδας δίσκου άνω των 4 ετών και, στη συνέχεια, σχεδιάσαμε το RBER για κάθε ομάδα σε σχέση με τον αριθμό των κύκλων PE. Το σχήμα 3 δείχνει αυτά τα αποτελέσματα για το μοντέλο κίνησης MLC-D. Βλέπουμε μια αξιοσημείωτη διαφορά στις τιμές RBER μεταξύ των ομάδων παλιών και νέων δίσκων σε όλους τους κύκλους PE.

Από αυτό, συμπεραίνουμε ότι η ηλικία, μετρούμενη με τις ημέρες χρήσης του δίσκου στο πεδίο, έχει σημαντικό αντίκτυπο στο RBER, ανεξάρτητα από τη φθορά των κυττάρων μνήμης λόγω έκθεσης σε κύκλους PE. Αυτό σημαίνει ότι άλλοι παράγοντες, όπως η γήρανση του πυριτίου, παίζουν μεγάλο ρόλο στη φυσική φθορά του δίσκου.

4.2.3. RBER και φόρτος εργασίας.

Τα σφάλματα bit πιστεύεται ότι προκαλούνται από έναν από τους τέσσερις μηχανισμούς:

  1. σφάλματα αποθήκευσης Σφάλματα διατήρησης, όταν μια κυψέλη μνήμης χάνει δεδομένα με την πάροδο του χρόνου
    ошибки нарушения чтения Read disturb errors, при которых операция чтения повреждает содержимое соседней ячейки;
  2. Εγγραφή σφαλμάτων διαταραχής, στα οποία μια λειτουργία ανάγνωσης βλάπτει τα περιεχόμενα ενός παρακείμενου κελιού.
  3. Ημιτελή σφάλματα διαγραφής, όταν η λειτουργία διαγραφής δεν διαγράφει πλήρως τα περιεχόμενα του κελιού.

Τα σφάλματα των τριών τελευταίων τύπων (διαταραχή ανάγνωσης, διαταραχή εγγραφής, ελλιπής διαγραφή) συσχετίζονται με τον φόρτο εργασίας, επομένως η κατανόηση της συσχέτισης μεταξύ RBER και φόρτου εργασίας μας βοηθά να κατανοήσουμε την επικράτηση διαφορετικών μηχανισμών σφαλμάτων. Σε μια πρόσφατη μελέτη, «Μια μεγάλης κλίμακας μελέτη των αστοχιών μνήμης flash στο πεδίο» (MEZA, J., WU, Q., KUMAR, S., MUTLU, O. «Μια μεγάλης κλίμακας μελέτη των αστοχιών μνήμης flash στο το πεδίο." Στο Proceedings of the 2015 ACM SIGMETRICS International Conference on Measurement and Modeling of Computer Systems, Νέα Υόρκη, 2015, SIGMETRICS '15, ACM, σελ. 177–190) κατέληξε στο συμπέρασμα ότι τα σφάλματα αποθήκευσης κυριαρχούν στο πεδίο, ενώ τα σφάλματα ανάγνωσης είναι αρκετά ήσσονος σημασίας.

Το σχήμα 1 δείχνει μια σημαντική σχέση μεταξύ της τιμής RBER σε έναν δεδομένο μήνα ζωής του δίσκου και του αριθμού των αναγνώσεων, εγγραφών και διαγραφών τον ίδιο μήνα για ορισμένα μοντέλα (για παράδειγμα, ο συντελεστής συσχέτισης είναι υψηλότερος από 0,2 για το MLC - B μοντέλο και υψηλότερο από 0,6 για το SLC-B). Ωστόσο, είναι πιθανό να πρόκειται για ψευδή συσχέτιση, καθώς ο μηνιαίος φόρτος εργασίας μπορεί να σχετίζεται με τον συνολικό αριθμό των κύκλων PE.

Χρησιμοποιήσαμε την ίδια μεθοδολογία που περιγράφεται στην Ενότητα 4.2.2 για να απομονώσουμε τις επιπτώσεις του φόρτου εργασίας από τις επιδράσεις των κύκλων PE απομονώνοντας μήνες λειτουργίας μονάδας με βάση τους προηγούμενους κύκλους PE και στη συνέχεια προσδιορίζοντας τους συντελεστές συσχέτισης ξεχωριστά για κάθε δοχείο.

Мы увидели, что корреляция между числом операций чтения в определенном месяце эксплуатации диска и значение RBER в этом же месяце сохраняется для моделей MLC-B и SLC-B, даже при ограничении циклов PE. Мы также повторили аналогичный анализ, где исключили эффект воздействия операций чтения на количество параллельных операций записи и стирания, и пришли к выводу, что корреляция между RBER и числом операций чтения сохраняется для модели SLC-B.

Το σχήμα 1 δείχνει επίσης τη συσχέτιση μεταξύ RBER και πράξεων εγγραφής και διαγραφής, επομένως επαναλάβαμε την ίδια ανάλυση για τις πράξεις ανάγνωσης, εγγραφής και διαγραφής. Συμπεραίνουμε ότι περιορίζοντας τον αντίκτυπο των κύκλων PE και των αναγνώσεων, δεν υπάρχει σχέση μεταξύ της τιμής RBER και του αριθμού των εγγραφών και διαγραφών.

Έτσι, υπάρχουν μοντέλα δίσκων όπου τα σφάλματα παραβίασης ανάγνωσης έχουν σημαντικό αντίκτυπο στο RBER. Από την άλλη πλευρά, δεν υπάρχουν στοιχεία ότι το RBER επηρεάζεται από σφάλματα παραβίασης εγγραφής και σφάλματα ατελούς διαγραφής.

4.2.4 RBER και λιθογραφία.

Οι διαφορές στο μέγεθος του αντικειμένου μπορεί να εξηγούν εν μέρει τις διαφορές στις τιμές RBER μεταξύ μοντέλων μονάδων δίσκου που χρησιμοποιούν την ίδια τεχνολογία, π.χ. MLC ή SLC. (Δείτε τον Πίνακα 1 για μια επισκόπηση της λιθογραφίας των διαφόρων μοντέλων που περιλαμβάνονται σε αυτή τη μελέτη).

Για παράδειγμα, 2 μοντέλα SLC με λιθογραφία 34 nm (μοντέλα SLC-A και SLC-D) έχουν RBER που είναι τάξη μεγέθους υψηλότερο από αυτό 2 μοντέλων με μικροηλεκτρονική λιθογραφία 50 nm (μοντέλα SLC-B και SLC-C). Στην περίπτωση των μοντέλων MLC, μόνο το μοντέλο 43 nm (MLC-B) έχει διάμεσο RBER που είναι 50% υψηλότερο από τα άλλα 3 μοντέλα με λιθογραφία 50 nm. Επιπλέον, αυτή η διαφορά στο RBER αυξάνεται κατά 4 καθώς φθείρονται οι μονάδες δίσκου, όπως φαίνεται στο Σχήμα 2. Τέλος, η πιο λεπτή λιθογραφία μπορεί να εξηγήσει το υψηλότερο RBER των ηλεκτροκινητήρων eMLC σε σύγκριση με τις μονάδες MLC. Συνολικά, έχουμε σαφή στοιχεία ότι η λιθογραφία επηρεάζει το RBER.

4.2.5. Наличие других ошибок.

Ερευνήσαμε τη σχέση μεταξύ του RBER και άλλων τύπων σφαλμάτων, όπως μη διορθώσιμα σφάλματα, σφάλματα χρονικού ορίου λήξης κ.λπ., ειδικότερα, εάν η τιμή RBER γίνεται υψηλότερη μετά από ένα μήνα έκθεσης σε άλλους τύπους σφαλμάτων.

Το Σχήμα 1 δείχνει ότι ενώ το RBER του προηγούμενου μήνα είναι προγνωστικό για μελλοντικές τιμές RBER (συντελεστής συσχέτισης μεγαλύτερος από 0,8), δεν υπάρχει σημαντική συσχέτιση μεταξύ μη διορθώσιμων σφαλμάτων και RBER (δεξιά ομάδα στοιχείων στο Σχήμα 1). Για άλλους τύπους σφαλμάτων, ο συντελεστής συσχέτισης είναι ακόμη χαμηλότερος (δεν φαίνεται στο σχήμα). Εξερευνήσαμε περαιτέρω τη σχέση μεταξύ RBER και μη διορθώσιμων σφαλμάτων στην Ενότητα 5.2 αυτής της εργασίας.

4.2.6. Επιρροή άλλων παραγόντων.

Мы нашли доказательства того, что существуют факторы, оказывающие значительное влияние на RBER и которые не смогли учесть полученные нами данные. В частности, мы заметили, что RBER для конкретной модели диска варьируется в зависимости от кластера, в котором развернут диск. Наглядным примером является Рисунок 4, на котором показана зависимость RBER от циклов PE для приводов модели MLC-D в трех разных кластерах (пунктирные линии) и сравнение её с RBER для этой модели относительно обще количества дисков (сплошная линия). Мы считаем, что эти различия сохраняются, даже когда мы ограничиваем влияние таких факторов, как возраст диска или количество операций чтения.

Μια πιθανή εξήγηση για αυτό είναι οι διαφορές στον τύπο φόρτου εργασίας μεταξύ των συστάδων, καθώς παρατηρούμε ότι τα συμπλέγματα των οποίων ο φόρτος εργασίας έχουν τους υψηλότερους λόγους ανάγνωσης/εγγραφής έχουν το υψηλότερο RBER.

Αξιοπιστία μνήμης flash: αναμενόμενη και μη αναμενόμενη. Μέρος 2. XIV συνέδριο της ένωσης USENIX. Τεχνολογίες αποθήκευσης αρχείων
Ρύζι. 4 α), β). Μέσες τιμές RBER ως συνάρτηση των κύκλων PE για τρία διαφορετικά συμπλέγματα και εξάρτηση της αναλογίας ανάγνωσης/εγγραφής από τον αριθμό των κύκλων PE για τρία διαφορετικά συμπλέγματα.

Για παράδειγμα, το Σχήμα 4(β) δείχνει τις αναλογίες ανάγνωσης/εγγραφής διαφορετικών συμπλεγμάτων για το μοντέλο μονάδας δίσκου MLC-D. Ωστόσο, η αναλογία ανάγνωσης/εγγραφής δεν εξηγεί τις διαφορές μεταξύ των συμπλεγμάτων για όλα τα μοντέλα, επομένως ενδέχεται να υπάρχουν άλλοι παράγοντες που τα δεδομένα μας δεν λαμβάνουν υπόψη, όπως περιβαλλοντικούς παράγοντες ή άλλες εξωτερικές παραμέτρους φόρτου εργασίας.

4.3. RBER κατά τη διάρκεια δοκιμών επιταχυνόμενης αντοχής.

Οι περισσότερες επιστημονικές εργασίες, καθώς και οι δοκιμές που πραγματοποιούνται κατά την αγορά μέσων σε βιομηχανική κλίμακα, προβλέπουν την αξιοπιστία των συσκευών στο πεδίο με βάση τα αποτελέσματα των επιταχυνόμενων δοκιμών ανθεκτικότητας. Αποφασίσαμε να καταλάβουμε πόσο καλά τα αποτελέσματα τέτοιων δοκιμών αντιστοιχούν στην πρακτική εμπειρία στη λειτουργία μέσων αποθήκευσης στερεάς κατάστασης.
Η ανάλυση των αποτελεσμάτων των δοκιμών που διεξήχθη χρησιμοποιώντας τη γενική μεθοδολογία ταχείας δοκιμής για εξοπλισμό που παρέχεται στα κέντρα δεδομένων της Google έδειξε ότι οι τιμές RBER στο πεδίο είναι σημαντικά υψηλότερες από τις προβλεπόμενες. Για παράδειγμα, για το μοντέλο eMLC-a, ο διάμεσος RBER για δίσκους που λειτουργούσαν στο πεδίο (στο τέλος της δοκιμής ο αριθμός των κύκλων PE έφτασε τους 600) ήταν 1e-05, ενώ σύμφωνα με τα αποτελέσματα των προκαταρκτικών επιταχυνόμενων δοκιμών, αυτό το RBER Η τιμή πρέπει να αντιστοιχεί σε περισσότερους από 4000 κύκλους PE. Αυτό δείχνει ότι είναι πολύ δύσκολο να προβλεφθεί με ακρίβεια η τιμή RBER στο πεδίο με βάση τις εκτιμήσεις RBER που ελήφθησαν από εργαστηριακές δοκιμές.

Σημειώσαμε επίσης ότι ορισμένοι τύποι σφαλμάτων είναι αρκετά δύσκολο να αναπαραχθούν κατά τη διάρκεια επιταχυνόμενων δοκιμών. Για παράδειγμα, στην περίπτωση του μοντέλου MLC-B, σχεδόν το 60% των μονάδων δίσκου στο πεδίο αντιμετωπίζουν μη διορθώσιμα σφάλματα και σχεδόν το 80% των μονάδων δίσκων αναπτύσσουν κακά μπλοκ. Ωστόσο, κατά τη διάρκεια των επιταχυνόμενων δοκιμών αντοχής, καμία από τις έξι συσκευές δεν παρουσίασε μη διορθώσιμα σφάλματα έως ότου οι μονάδες έφτασαν περισσότερο από το τριπλάσιο του ορίου κύκλου PE. Για τα μοντέλα eMLC, παρουσιάστηκαν μη διορθώσιμα σφάλματα σε περισσότερο από το 80% των μονάδων δίσκου στο πεδίο, ενώ κατά τη διάρκεια των επιταχυνόμενων δοκιμών τέτοια σφάλματα εμφανίστηκαν μετά την επίτευξη των 15000 κύκλων PE.

Εξετάσαμε επίσης το RBER που αναφέρθηκε σε προηγούμενη ερευνητική εργασία, το οποίο βασίστηκε σε πειράματα σε ελεγχόμενο περιβάλλον, και καταλήξαμε στο συμπέρασμα ότι το εύρος των τιμών ήταν εξαιρετικά ευρύ. Για παράδειγμα, ο L.M. Ο Grupp και άλλοι στην εργασία τους 2009-2012 αναφέρουν τιμές RBER για μονάδες δίσκου που πλησιάζουν να φτάσουν τα όρια κύκλου PE. Για παράδειγμα, για συσκευές SLC και MLC με μεγέθη λιθογραφίας παρόμοια με αυτά που χρησιμοποιούνται στην εργασία μας (25-50nm), η τιμή RBER κυμαίνεται από 1e-08 έως 1e-03, με τα περισσότερα μοντέλα δίσκου που έχουν δοκιμαστεί με τιμή RBER κοντά στο 1e- 06.

Στη μελέτη μας, τα τρία μοντέλα κίνησης που έφτασαν το όριο κύκλου PE είχαν RBER που κυμαίνονταν από 3e-08 έως 8e-08. Ακόμη και αν λάβουμε υπόψη ότι οι αριθμοί μας είναι χαμηλότερα όρια και θα μπορούσαν να είναι 16 φορές μεγαλύτεροι στην απόλυτη χειρότερη περίπτωση, ή λαμβάνοντας υπόψη το 95ο εκατοστημόριο του RBER, οι τιμές μας εξακολουθούν να είναι σημαντικά χαμηλότερες.

Συνολικά, ενώ οι πραγματικές τιμές RBER πεδίου είναι υψηλότερες από τις προβλεπόμενες τιμές με βάση τις επιταχυνόμενες δοκιμές ανθεκτικότητας, εξακολουθούν να είναι χαμηλότερες από τις περισσότερες τιμές RBER για παρόμοιες συσκευές που αναφέρονται σε άλλες ερευνητικές εργασίες και υπολογίζονται από εργαστηριακές δοκιμές. Αυτό σημαίνει ότι δεν πρέπει να βασίζεστε σε προβλεπόμενες τιμές RBER στο πεδίο που έχουν προκύψει από επιταχυνόμενες δοκιμές ανθεκτικότητας.

5. Αδιόρθωτα λάθη.

Δεδομένης της ευρέως διαδεδομένης εμφάνισης μη διορθώσιμων σφαλμάτων (UEs), τα οποία συζητήθηκαν στην Ενότητα 3 αυτής της εργασίας, σε αυτήν την ενότητα διερευνούμε τα χαρακτηριστικά τους με περισσότερες λεπτομέρειες. Ξεκινάμε συζητώντας ποια μέτρηση θα χρησιμοποιήσουμε για τη μέτρηση της UE, πώς σχετίζεται με το RBER και πώς η UE επηρεάζεται από διάφορους παράγοντες.

5.1. Γιατί η αναλογία UBER δεν έχει νόημα.

Η τυπική μέτρηση που χαρακτηρίζει τα μη διορθώσιμα σφάλματα είναι ο ρυθμός σφάλματος UBER μη διορθώσιμου bit, δηλαδή ο λόγος του αριθμού των μη διορθώσιμων σφαλμάτων bit προς τον συνολικό αριθμό των bit που διαβάστηκαν.

Αυτή η μέτρηση υποθέτει σιωπηρά ότι ο αριθμός των μη διορθώσιμων σφαλμάτων είναι κατά κάποιο τρόπο συνδεδεμένος με τον αριθμό των μπιτ που διαβάζονται και επομένως πρέπει να κανονικοποιηθεί με αυτόν τον αριθμό.

Αυτή η υπόθεση ισχύει για διορθώσιμα σφάλματα, όπου ο αριθμός των σφαλμάτων που παρατηρήθηκαν σε έναν δεδομένο μήνα βρέθηκε ότι συσχετίζεται σε μεγάλο βαθμό με τον αριθμό των αναγνώσεων κατά την ίδια χρονική περίοδο (συντελεστής συσχέτισης Spearman μεγαλύτερος από 0.9). Ο λόγος για έναν τόσο ισχυρό συσχετισμό είναι ότι ακόμη και ένα κακό bit, εφόσον είναι διορθώσιμο με χρήση ECC, θα συνεχίσει να αυξάνει τον αριθμό των σφαλμάτων με κάθε λειτουργία ανάγνωσης που έχει πρόσβαση, καθώς η αξιολόγηση του κελιού που περιέχει το κακό bit είναι δεν διορθώνεται αμέσως όταν εντοπιστεί σφάλμα (οι δίσκοι επανεγγράφουν μόνο περιοδικά σελίδες με κατεστραμμένα bits).

Η ίδια υπόθεση δεν ισχύει για λάθη που δεν μπορούν να διορθωθούν. Ένα μη διορθώσιμο σφάλμα αποκλείει την περαιτέρω χρήση του κατεστραμμένου μπλοκ, επομένως, εφόσον εντοπιστεί, ένα τέτοιο μπλοκ δεν θα επηρεάσει τον αριθμό των σφαλμάτων στο μέλλον.

Για να επιβεβαιώσουμε επίσημα αυτήν την υπόθεση, χρησιμοποιήσαμε διάφορες μετρήσεις για να μετρήσουμε τη σχέση μεταξύ του αριθμού αναγνώσεων σε έναν δεδομένο μήνα ζωής του δίσκου και του αριθμού των μη διορθώσιμων σφαλμάτων κατά την ίδια χρονική περίοδο, συμπεριλαμβανομένων διαφόρων συντελεστών συσχέτισης (Pearson, Spearman, Kendall) , καθώς και οπτική επιθεώρηση γραφημάτων . Εκτός από τον αριθμό των μη διορθώσιμων σφαλμάτων, εξετάσαμε επίσης τη συχνότητα των αδιόρθωτων περιστατικών σφαλμάτων (δηλαδή, την πιθανότητα ένας δίσκος να έχει τουλάχιστον ένα τέτοιο περιστατικό κατά τη διάρκεια μιας δεδομένης χρονικής περιόδου) και τη σχέση τους με τις λειτουργίες ανάγνωσης.
Δεν βρήκαμε στοιχεία συσχέτισης μεταξύ του αριθμού των αναγνώσεων και του αριθμού των μη διορθώσιμων σφαλμάτων. Για όλα τα μοντέλα μονάδας δίσκου, οι συντελεστές συσχέτισης ήταν κάτω από 0.02 και τα γραφήματα δεν έδειξαν καμία αύξηση στο UE καθώς αυξανόταν ο αριθμός των αναγνώσεων.

Στην ενότητα 5.4 αυτής της εργασίας, συζητάμε ότι οι λειτουργίες εγγραφής και διαγραφής δεν έχουν επίσης σχέση με μη διορθωμένα σφάλματα, επομένως ο εναλλακτικός ορισμός του UBER, ο οποίος κανονικοποιείται με πράξεις εγγραφής ή διαγραφής αντί για λειτουργίες ανάγνωσης, δεν έχει νόημα.

Επομένως, συμπεραίνουμε ότι το UBER δεν είναι μια μέτρηση με νόημα, εκτός ίσως όταν δοκιμάζεται σε ελεγχόμενα περιβάλλοντα όπου ο αριθμός των αναγνώσεων ορίζεται από τον πειραματιστή. Εάν το UBER χρησιμοποιείται ως μέτρηση κατά τη διάρκεια της δοκιμής πεδίου, θα μειώσει τεχνητά το ποσοστό σφάλματος για μονάδες δίσκου με υψηλό αριθμό αναγνώσεων και θα διογκώσει τεχνητά το ποσοστό σφαλμάτων για μονάδες με χαμηλό αριθμό αναγνώσεων, καθώς προκύπτουν μη διορθώσιμα σφάλματα ανεξάρτητα από τον αριθμό των αναγνώσεων.

5.2. Αδιόρθωτα λάθη και RBER.

Η συνάφεια του RBER εξηγείται από το γεγονός ότι χρησιμεύει ως μέτρο για τον προσδιορισμό της συνολικής αξιοπιστίας της μονάδας δίσκου, ιδίως με βάση την πιθανότητα μη διορθώσιμων σφαλμάτων. Στην εργασία τους, οι N. Mielke et al το 2008 ήταν οι πρώτοι που πρότειναν τον ορισμό του αναμενόμενου μη διορθώσιμου ποσοστού σφάλματος ως συνάρτηση του RBER. Έκτοτε, πολλοί προγραμματιστές συστημάτων έχουν χρησιμοποιήσει παρόμοιες μεθόδους, όπως την εκτίμηση του αναμενόμενου ποσοστού μη διορθώσιμου σφάλματος ως συνάρτηση του τύπου RBER και ECC.

Ο σκοπός αυτής της ενότητας είναι να χαρακτηρίσει πόσο καλά το RBER προβλέπει μη διορθώσιμα σφάλματα. Ας ξεκινήσουμε με το Σχήμα 5α, το οποίο απεικονίζει το διάμεσο RBER για έναν αριθμό μοντέλων μονάδας δίσκου πρώτης γενιάς σε σχέση με το ποσοστό των ημερών που χρησιμοποιήθηκαν και παρουσίασαν μη διορθωμένα σφάλματα UE. Θα πρέπει να σημειωθεί ότι ορισμένα από τα 16 μοντέλα που εμφανίζονται στο γράφημα δεν περιλαμβάνονται στον Πίνακα 1 λόγω έλλειψης αναλυτικών πληροφοριών.

Αξιοπιστία μνήμης flash: αναμενόμενη και μη αναμενόμενη. Μέρος 2. XIV συνέδριο της ένωσης USENIX. Τεχνολογίες αποθήκευσης αρχείων
Ρύζι. 5α. Σχέση μεταξύ διάμεσου RBER και μη διορθώσιμων σφαλμάτων για διάφορα μοντέλα κίνησης.

Αξιοπιστία μνήμης flash: αναμενόμενη και μη αναμενόμενη. Μέρος 2. XIV συνέδριο της ένωσης USENIX. Τεχνολογίες αποθήκευσης αρχείων
Ρύζι. 5β. Σχέση μεταξύ διάμεσου RBER και μη διορθώσιμων σφαλμάτων για διαφορετικούς δίσκους του ίδιου μοντέλου.

Напомним, что все модели в рамках одного поколения используют одинаковый механизм ECC, так что различия между моделями не зависят от различий ECC. Мы не увидели корреляции между RBER и инцидентами UE. Мы создали такой же график для 95-го процентиля RBER в сравнении с вероятностью UE и снова не увидели никакой корреляции.

Στη συνέχεια, επαναλάβαμε την ανάλυση σε κοκκώδες επίπεδο για μεμονωμένες μονάδες δίσκου, δηλαδή προσπαθήσαμε να μάθουμε εάν υπήρχαν μονάδες όπου μια υψηλότερη τιμή RBER αντιστοιχεί σε υψηλότερη συχνότητα UE. Για παράδειγμα, το Σχήμα 5β απεικονίζει το διάμεσο RBER για κάθε μονάδα δίσκου του μοντέλου MLC-c σε σχέση με τον αριθμό των UEs (αποτελέσματα παρόμοια με αυτά που λαμβάνονται για το 95ο εκατοστημόριο RBER). Και πάλι, δεν είδαμε καμία συσχέτιση μεταξύ RBER και UE.

Τέλος, πραγματοποιήσαμε μια πιο ακριβή ανάλυση χρονισμού για να εξετάσουμε εάν οι μήνες λειτουργίας των μονάδων δίσκου με υψηλότερο RBER θα αντιστοιχούσαν στους μήνες κατά τους οποίους συνέβησαν τα UE. Το Σχήμα 1 έχει ήδη δείξει ότι ο συντελεστής συσχέτισης μεταξύ μη διορθώσιμων σφαλμάτων και RBER είναι πολύ χαμηλός. Πειραματιστήκαμε επίσης με διαφορετικούς τρόπους σχεδίασης της πιθανότητας UE ως συνάρτηση του RBER και δεν βρήκαμε στοιχεία συσχέτισης.

Έτσι, συμπεραίνουμε ότι το RBER είναι μια αναξιόπιστη μέτρηση για την πρόβλεψη της UE. Αυτό μπορεί να σημαίνει ότι οι μηχανισμοί αστοχίας που οδηγούν στο RBER είναι διαφορετικοί από τους μηχανισμούς που οδηγούν σε μη διορθωμένα σφάλματα (π.χ. σφάλματα που περιέχονται σε μεμονωμένα κελιά έναντι μεγαλύτερων προβλημάτων που εμφανίζονται με ολόκληρη τη συσκευή).

5.3. Αδιόρθωτα σφάλματα και φθορά.

Δεδομένου ότι η φθορά είναι ένα από τα κύρια προβλήματα της μνήμης flash, το σχήμα 6 δείχνει την ημερήσια πιθανότητα μη διορθώσιμων σφαλμάτων μονάδας δίσκου ως συνάρτηση των κύκλων PE.

Αξιοπιστία μνήμης flash: αναμενόμενη και μη αναμενόμενη. Μέρος 2. XIV συνέδριο της ένωσης USENIX. Τεχνολογίες αποθήκευσης αρχείων
Εικόνα 6. Ημερήσια πιθανότητα εμφάνισης μη διορθώσιμων σφαλμάτων μονάδας, ανάλογα με τους κύκλους PE.

Σημειώνουμε ότι η πιθανότητα ενός UE αυξάνεται συνεχώς με την ηλικία του δίσκου. Ωστόσο, όπως και με το RBER, η αύξηση είναι πιο αργή από ό,τι συνήθως υποτίθεται: τα γραφήματα δείχνουν ότι οι UE αυξάνονται γραμμικά παρά εκθετικά με τους κύκλους PE.

Δύο συμπεράσματα που καταλήξαμε για το RBER ισχύουν και για τις UE: πρώτον, δεν υπάρχει σαφής αύξηση του δυναμικού σφάλματος μόλις επιτευχθεί το όριο κύκλου PE, όπως στο σχήμα 6 για το μοντέλο MLC-D του οποίου το όριο κύκλου PE είναι 3000. Δεύτερον, Δεύτερον , το ποσοστό σφάλματος ποικίλλει μεταξύ διαφορετικών μοντέλων, ακόμη και στην ίδια κατηγορία. Ωστόσο, αυτές οι διαφορές δεν είναι τόσο μεγάλες όσο για το RBER.

Τέλος, για να υποστηρίξουμε τα ευρήματά μας στην Ενότητα 5.2, βρήκαμε ότι μέσα σε μια κατηγορία μοντέλων (MLC έναντι SLC), τα μοντέλα με τις χαμηλότερες τιμές RBER για έναν δεδομένο αριθμό κύκλων PE δεν είναι απαραίτητα αυτά με τη χαμηλότερη πιθανότητα εμφάνισης UE. Για παράδειγμα, πάνω από 3000 κύκλους PE, τα μοντέλα MLC-D είχαν τιμές RBER 4 φορές χαμηλότερες από τα μοντέλα MLC-B, αλλά η πιθανότητα UE για τον ίδιο αριθμό κύκλων PE ήταν ελαφρώς υψηλότερη για τα μοντέλα MLC-D από ό,τι για τα μοντέλα MLC-B μοντέλα.

Αξιοπιστία μνήμης flash: αναμενόμενη και μη αναμενόμενη. Μέρος 2. XIV συνέδριο της ένωσης USENIX. Τεχνολογίες αποθήκευσης αρχείων
Εικόνα 7. Μηνιαία πιθανότητα εμφάνισης μη διορθώσιμων σφαλμάτων μονάδας δίσκου ως συνάρτηση της παρουσίας προηγούμενων σφαλμάτων διαφόρων τύπων.

5.4. Αδιόρθωτα σφάλματα και φόρτος εργασίας.

Για τους ίδιους λόγους που ο φόρτος εργασίας μπορεί να επηρεάσει το RBER (βλ. Ενότητα 4.2.3), μπορεί να αναμένεται να επηρεάσει και το UE. Για παράδειγμα, δεδομένου ότι παρατηρήσαμε ότι τα σφάλματα παραβίασης ανάγνωσης επηρεάζουν το RBER, οι λειτουργίες ανάγνωσης μπορεί επίσης να αυξήσουν την πιθανότητα μη διορθώσιμων σφαλμάτων.

Πραγματοποιήσαμε μια λεπτομερή μελέτη σχετικά με τον αντίκτυπο του φόρτου εργασίας στην ΕΕ. Ωστόσο, όπως σημειώθηκε στην Ενότητα 5.1, δεν βρήκαμε σχέση μεταξύ του UE και του αριθμού των αναγνώσεων. Επαναλάβαμε την ίδια ανάλυση για τις πράξεις εγγραφής και διαγραφής και πάλι δεν είδαμε καμία συσχέτιση.
Σημειώστε ότι με την πρώτη ματιά, αυτό φαίνεται να έρχεται σε αντίθεση με την προηγούμενη παρατήρησή μας ότι τα μη διορθώσιμα σφάλματα συσχετίζονται με τους κύκλους PE. Επομένως, θα περίμενε κανείς μια συσχέτιση με τον αριθμό των πράξεων εγγραφής και διαγραφής.

Ωστόσο, στην ανάλυσή μας για τον αντίκτυπο των κύκλων PE, συγκρίναμε τον αριθμό των μη διορθώσιμων σφαλμάτων σε έναν δεδομένο μήνα με τον συνολικό αριθμό κύκλων PE που έχει βιώσει η μονάδα σε όλη τη διάρκεια ζωής της μέχρι σήμερα, προκειμένου να μετρήσουμε την επίδραση της φθοράς. Κατά τη μελέτη της επίδρασης του φόρτου εργασίας, εξετάσαμε τους μήνες λειτουργίας της μονάδας δίσκου που είχαν τον υψηλότερο αριθμό λειτουργιών ανάγνωσης/εγγραφής/διαγραφής σε έναν συγκεκριμένο μήνα, οι οποίες είχαν επίσης περισσότερες πιθανότητες να προκαλέσουν μη διορθώσιμα σφάλματα, δηλαδή δεν λάβαμε υπόψη υπολογίστε τον συνολικό αριθμό των πράξεων ανάγνωσης/εγγραφής/διαγραφής.διαγραφή.

Ως αποτέλεσμα, καταλήξαμε στο συμπέρασμα ότι τα σφάλματα παραβίασης ανάγνωσης, τα σφάλματα παραβίασης εγγραφής και τα σφάλματα ατελούς διαγραφής δεν είναι οι κύριοι παράγοντες για την ανάπτυξη μη διορθώσιμων σφαλμάτων.

Σας ευχαριστούμε που μείνατε μαζί μας. Σας αρέσουν τα άρθρα μας; Θέλετε να δείτε πιο ενδιαφέρον περιεχόμενο; Υποστηρίξτε μας κάνοντας μια παραγγελία ή προτείνοντας σε φίλους, Έκπτωση 30% για χρήστες Habr σε ένα μοναδικό ανάλογο διακομιστών εισαγωγικού επιπέδου, που εφευρέθηκε από εμάς για εσάς: Όλη η αλήθεια για το VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps από 20 $ ή πώς να μοιραστείτε έναν διακομιστή; (διατίθεται με RAID1 και RAID10, έως 24 πυρήνες και έως 40 GB DDR4).

Dell R730xd 2 φορές φθηνότερο; Μόνο εδώ 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 Τηλεόραση από 199$ στην Ολλανδία! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - από 99$! Διαβάστε σχετικά Πώς να χτίσετε την υποδομή Corp. κατηγορίας με τη χρήση διακομιστών Dell R730xd E5-2650 v4 αξίας 9000 ευρώ για μια δεκάρα;

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο