Το σφάλμα στην CPU AMD EPYC 7002 παγώνει μετά από 1044 ημέρες λειτουργίας

Η σειρά επεξεργαστών διακομιστών AMD EPYC 2018 ("Rome") που βασίζεται στη μικροαρχιτεκτονική "Zen 7002" που έχει αποσταλεί από το 2 έχει ένα σφάλμα που προκαλεί τον επεξεργαστή να "κολλάει" μετά από 1044 ημέρες λειτουργίας χωρίς επαναφορά κατάστασης (επανεκκίνηση συστήματος). Ως εναλλακτικές λύσεις για τον αποκλεισμό του ζητήματος, συνιστάται η απενεργοποίηση της υποστήριξης λειτουργίας εξοικονόμησης ενέργειας CC6 ή η επανεκκίνηση του διακομιστή περισσότερες από μία φορά κάθε 1044 ημέρες (περίπου 2 έτη 10 μήνες).

Σύμφωνα με πληροφορίες που δημοσίευσε η AMD, το hang προκαλείται από ένα σφάλμα που συμβαίνει όταν ο πυρήνας του επεξεργαστή προσπαθεί να ξυπνήσει από τη λειτουργία εξοικονόμησης ενέργειας CC6 (core-C6, μειώνει την τάση όταν είναι αδρανής) όταν ο χρονοδιακόπτης φτάσει την τιμή των 1044 ημερών μετά την τελευταία επαναφορά της κατάστασης της CPU (ο χρόνος εκδήλωσης μπορεί να διαφέρει ανάλογα με τη συχνότητα REFCLK).

Η AMD δεν παρέχει πιο λεπτομερή εξήγηση για την αιτία της αποτυχίας. Κρίνοντας από την υπόθεση που δημοσιεύτηκε στο Reddit, το hang συμβαίνει όταν ο μετρητής στον καταχωρητή TSC (Time Stamp Counter), ο οποίος μετράει τον αριθμό των κύκλων εργασίας μετά την επαναφορά, σε συχνότητα 2800 MHz φτάσει την τιμή 0x380000000000000 (2800 MHz * 10 *6 * 1042.5, δηλαδή μετά από 1042 ημέρες και 12 ώρες).

Η διόρθωση σφαλμάτων δεν πρόκειται να δημοσιευτεί. Το πρόβλημα παρέμεινε απαρατήρητο για μεγάλο χρονικό διάστημα, καθώς οι χρόνοι λειτουργίας πολλών ετών δεν είναι τυπικοί για διακομιστές που, για να διατηρούνται ενημερωμένοι, πρέπει περιοδικά να επανεκκινούνται για να εγκαταστήσουν ενημερώσεις πυρήνα ή να μεταβούν σε νέα έκδοση του λειτουργικού συστήματος. Ωστόσο, οι μέθοδοι αναβάθμισης του πυρήνα χωρίς επανεκκίνηση των διανομών Linux, καθώς και οι μεγάλοι κύκλοι συντήρησης (υποστηρίζονται τα Ubuntu, RHEL και SUSE για 10 χρόνια), μπορεί να έχουν ως αποτέλεσμα την εύρεση διακομιστών για μεγάλο χρονικό διάστημα χωρίς επανεκκίνηση.

Πηγή: opennet.ru

Προσθέστε ένα σχόλιο