Napaka v procesorju AMD EPYC 7002 zamrzne po 1044 dneh delovanja

Serija strežniških procesorjev AMD EPYC 2018 ("Rome"), ki temeljijo na mikroarhitekturi "Zen 7002", ki se dobavlja od leta 2, ima napako, ki povzroči, da procesor visi po 1044 dneh delovanja brez ponastavitve stanja (ponovni zagon sistema). Kot rešitev za blokiranje težave je priporočljivo, da onemogočite podporo za način varčevanja z energijo CC6 ali znova zaženete strežnik več kot enkrat na 1044 dni (približno 2 leti 10 mesecev).

Glede na informacije, ki jih je objavil AMD, je zastoj povzročil zrušitev, ki se pojavi, ko se jedro procesorja poskuša prebuditi iz načina varčevanja z energijo CC6 (core-C6, zniža napetost v mirovanju), ko časovnik doseže vrednost 1044 dni po zadnji ponastavitvi stanja CPU (čas manifestacije se lahko razlikuje glede na frekvenco REFCLK).

Podrobnejše razlage vzroka okvare AMD ne daje. Sodeč po predpostavki, objavljeni na Redditu, do zastoja pride, ko števec v registru TSC (Time Stamp Counter), ki šteje število delovnih ciklov po ponastavitvi, pri frekvenci 2800 MHz doseže vrednost 0x380000000000000 (2800 MHz * 10**6 * 1042.5, torej po 1042 dneh in 12 XNUMX uri).

Popravek napake ne bo objavljen. Težava je ostala dolgo časa neopažena, saj večletni časi delovanja niso značilni za strežnike, ki jih je treba občasno znova zagnati, da bi namestili posodobitve jedra ali preklopili na novo izdajo operacijskega sistema. Vendar lahko metode nadgradnje jedra brez ponovnega zagona distribucij Linuxa in dolgi vzdrževalni cikli (Ubuntu, RHEL in SUSE podpirajo 10 let) povzročijo dolge čakalne dobe za strežnike brez ponovnega zagona.

Vir: opennet.ru

Dodaj komentar