Εντοπίστηκε ένα σφάλμα στη σειρά επεξεργαστών διακομιστών AMD EPYC 2018 ("Rome") που βασίζονται στη μικροαρχιτεκτονική "Zen 7002", οι οποίοι διατίθενται στην αγορά από το 2, με αποτέλεσμα ο επεξεργαστής να κολλάει μετά από 1044 ημέρες λειτουργίας χωρίς επαναφορά κατάστασης (επανεκκίνηση συστήματος). Ως λύση, συνιστάται η απενεργοποίηση της υποστήριξης για τη λειτουργία εξοικονόμησης ενέργειας CC6 ή η επανεκκίνηση του διακομιστή συχνότερα από μία φορά κάθε 1044 ημέρες (περίπου 2 χρόνια και 10 μήνες).
Σύμφωνα με πληροφορίες που δημοσίευσε η AMD, το κολλημα προκαλείται από μια βλάβη που παρουσιάζεται όταν ο πυρήνας του επεξεργαστή προσπαθεί να βγει από τη λειτουργία εξοικονόμησης ενέργειας του CC6 (πυρήνας-C6, μειώνει την τάση όταν είναι σε αδράνεια) όταν ο χρονοδιακόπτης φτάσει τις 1044 ημέρες από την τελευταία επαναφορά της κατάστασης της CPU (ο χρόνος εμφάνισης μπορεί να διαφέρει ανάλογα με τη συχνότητα REFCLK).
Η AMD δεν παρέχει μια πιο λεπτομερή εξήγηση για την αιτία της βλάβης. Σύμφωνα με μια πρόταση που δημοσιεύτηκε στο Reddit, το πάγωμα συμβαίνει όταν ο μετρητής στο μητρώο TSC (Time Stamp Counter), ο οποίος μετρά τον αριθμό των κύκλων εργασίας μετά από μια επαναφορά, σε συχνότητα 2800 MHz φτάνει στην τιμή 0x380000000000000 (2800 MHz * 10**6 * 1042.5, δηλαδή μετά από 1042 ημέρες και 12 ώρες).
Δεν υπάρχουν σχέδια για δημοσίευση κάποιας επιδιόρθωσης για το σφάλμα. Το πρόβλημα παρέμεινε απαρατήρητο για μεγάλο χρονικό διάστημα, καθώς οι μακροπρόθεσμοι χρόνοι λειτουργίας δεν είναι συνηθισμένοι. διακομιστές, τα οποία πρέπει να επανεκκινούνται περιοδικά για την εγκατάσταση ενημερώσεων πυρήνα ή για αναβάθμιση σε νέα έκδοση λειτουργικού συστήματος ώστε να διατηρούνται ενημερωμένα. Ωστόσο, η χρήση του Linux διανομές μεθόδων ενημέρωσης πυρήνα χωρίς επανεκκίνηση, καθώς και μεγάλοι κύκλοι συντήρησης (Ubuntu, RHEL και SUSE υποστηρίζονται για 10 χρόνια) μπορεί να οδηγήσει σε μεγάλο χρονικό διάστημα που οι διακομιστές δεν θα μπορούν να επανεκκινηθούν.
Πηγή: opennet.ru
