AMD EPYC 2018 ("Roma") serveru procesoru sērijai, kuras pamatā ir "Zen 7002" mikroarhitektūra, kas tiek piegādāta kopš 2. gada, ir kļūda, kas izraisa procesora uzkāršanos pēc 1044 dienu darbības bez stāvokļa atiestatīšanas (sistēmas atsāknēšanas). Lai novērstu problēmu, ieteicams atspējot CC6 enerģijas taupīšanas režīma atbalstu vai restartēt serveri biežāk nekā reizi 1044 dienās (aptuveni 2 gadi 10 mēneši).
Saskaņā ar AMD publicēto informāciju, uzkares cēlonis ir kļūme, kas rodas, kad procesora kodols mēģina pamosties no CC6 enerģijas taupīšanas režīma (core-C6, pazemina spriegumu dīkstāves laikā), kad taimeris sasniedz 1044 dienu vērtību. pēc pēdējās CPU stāvokļa atiestatīšanas (izpausmes laiks var atšķirties atkarībā no REFCLK frekvences).
AMD nesniedz sīkāku skaidrojumu par kļūmes cēloni. Spriežot pēc Reddit publicētā pieņēmuma, uzkarēšanās notiek, kad skaitītājs TSC (Time Stamp Counter) reģistrā, kas skaita darba ciklu skaitu pēc atiestatīšanas, ar frekvenci 2800 MHz sasniedz vērtību 0x380000000000000 (2800 MHz * 10*). *6 * 1042.5, t.i., pēc 1042 dienām un 12 stundām).
Nav plānu publicēt kļūdas labojumu. Problēma ilgu laiku palika nepamanīta, jo ilgs darbības laiks nav tipisks. serveriem, kas periodiski jārestartē, lai instalētu kodola atjauninājumus vai jauninātu uz jaunu operētājsistēmas versiju, lai nodrošinātu to atjaunināšanu. Tomēr Linux kodola atjaunināšanas metožu izplatīšana bez pārstartēšanas, kā arī ilgi apkopes cikli (Ubuntu, RHEL un SUSE tiek atbalstīti 10 gadus) var novest pie tā, ka serveri ilgstoši var darboties bez pārstartēšanas.
Avots: opennet.ru
