AMD EPYC 7002 CPU kļūda sasalst pēc 1044 dienām

AMD EPYC 2018 ("Roma") serveru procesoru sērijai, kuras pamatā ir "Zen 7002" mikroarhitektūra, kas tiek piegādāta kopš 2. gada, ir kļūda, kas izraisa procesora uzkāršanos pēc 1044 dienu darbības bez stāvokļa atiestatīšanas (sistēmas atsāknēšanas). Lai novērstu problēmu, ieteicams atspējot CC6 enerģijas taupīšanas režīma atbalstu vai restartēt serveri biežāk nekā reizi 1044 dienās (aptuveni 2 gadi 10 mēneši).

Saskaņā ar AMD publicēto informāciju, uzkares cēlonis ir kļūme, kas rodas, kad procesora kodols mēģina pamosties no CC6 enerģijas taupīšanas režīma (core-C6, pazemina spriegumu dīkstāves laikā), kad taimeris sasniedz 1044 dienu vērtību. pēc pēdējās CPU stāvokļa atiestatīšanas (izpausmes laiks var atšķirties atkarībā no REFCLK frekvences).

AMD nesniedz sīkāku skaidrojumu par kļūmes cēloni. Spriežot pēc Reddit publicētā pieņēmuma, uzkarēšanās notiek, kad skaitītājs TSC (Time Stamp Counter) reģistrā, kas skaita darba ciklu skaitu pēc atiestatīšanas, ar frekvenci 2800 MHz sasniedz vērtību 0x380000000000000 (2800 MHz * 10*). *6 * 1042.5, t.i., pēc 1042 dienām un 12 stundām).

Kļūdas labojums netiks publicēts. Problēma palika nepamanīta ilgu laiku, jo vairāku gadu darbības laiks nav raksturīgs serveriem, kuri, lai tie būtu atjaunināti, periodiski ir jārestartē, lai instalētu kodola atjauninājumus vai pārslēgtos uz jaunu operētājsistēmas laidienu. Tomēr Linux distribūciju kodola jaunināšanas metodes bez atkārtotas palaišanas, kā arī ilgi uzturēšanas cikli (Ubuntu, RHEL un SUSE tiek atbalstīti 10 gadus), var novest pie serveru atrašanas ilgu laiku bez atkārtotas palaišanas.

Avots: opennet.ru

Pievieno komentāru