Bug u AMD EPYC 7002 CPU-u se smrzava nakon 1044 dana rada

Serija poslužiteljskih procesora AMD EPYC 2018 ("Rome") temeljena na mikroarhitekturi "Zen 7002" koja se isporučuje od 2. ima grešku koja uzrokuje zastoj procesora nakon 1044 dana rada bez resetiranja stanja (ponovnog pokretanja sustava). Kao zaobilazna rješenja za blokiranje problema, preporučuje se onemogućiti podršku za CC6 način rada za uštedu energije ili ponovno pokrenuti poslužitelj više od jednom svaka 1044 dana (otprilike 2 godine i 10 mjeseci).

Prema informacijama koje je objavio AMD, zastoj je uzrokovan greškom koja se javlja kada se jezgra procesora pokuša probuditi iz CC6 načina rada za uštedu energije (jezgra-C6, snižava napon u mirovanju) kada mjerač vremena dosegne vrijednost od 1044 dana. nakon zadnjeg resetiranja stanja CPU-a (vrijeme manifestacije može varirati ovisno o frekvenciji REFCLK).

AMD ne daje detaljnije objašnjenje uzroka kvara. Sudeći prema pretpostavci objavljenoj na Redditu, do zastoja dolazi kada brojač u TSC (Time Stamp Counter) registru, koji broji broj radnih ciklusa nakon resetiranja, na frekvenciji od 2800 MHz dosegne vrijednost 0x380000000000000 (2800 MHz * 10* *6 * 1042.5, tj. nakon 1042 dana i 12 sati).

Ispravak greške neće biti objavljen. Problem je dugo ostao neprimijećen, budući da višegodišnja radna vremena nisu tipična za poslužitelje koji se, kako bi bili ažurni, povremeno moraju ponovno pokretati radi instaliranja ažuriranja kernela ili prebacivanja na novo izdanje operativnog sustava. Međutim, metode nadogradnje jezgre bez ponovnog pokretanja distribucija Linuxa, kao i dugi ciklusi održavanja (Ubuntu, RHEL i SUSE podržani su 10 godina), mogu rezultirati pronalaženjem poslužitelja dugo vremena bez ponovnog pokretanja.

Izvor: opennet.ru

Dodajte komentar