Virhe AMD EPYC 7002 -suorittimessa jäätyy 1044 päivän käytön jälkeen

AMD EPYC 2018 ("Rome") -sarjan "Zen 7002" -mikroarkkitehtuuriin perustuvissa palvelinprosessoreissa, jotka on toimitettu vuodesta 2 lähtien, on virhe, joka saa prosessorin jumittumaan 1044 päivän käytön jälkeen ilman tilan palautusta (järjestelmän uudelleenkäynnistys). Ongelman estämiseksi on suositeltavaa poistaa CC6-virransäästötilan tuki käytöstä tai käynnistää palvelin uudelleen useammin kuin kerran 1044 päivässä (noin 2 vuotta 10 kuukautta).

AMD:n julkaisemien tietojen mukaan jumittuminen johtuu häiriöstä, joka ilmenee, kun prosessorin ydin yrittää herätä CC6-virransäästötilasta (core-C6, alentaa jännitettä tyhjäkäynnillä), kun ajastin saavuttaa 1044 päivän arvon. viimeisen CPU-tilan nollauksen jälkeen (ilmennysaika voi vaihdella REFCLK-taajuuden mukaan).

AMD ei anna tarkempaa selitystä vian syystä. Redditissä julkaistun oletuksen perusteella jumiutuminen tapahtuu, kun TSC (Time Stamp Counter) -rekisterin laskuri, joka laskee työjaksojen määrän nollauksen jälkeen, saavuttaa 2800 MHz:n taajuudella arvon 0x380000000000000 (2800 MHz * 10*). *6 * 1042.5, eli 1042 päivän ja 12 tunnin kuluttua).

Virheenkorjausta ei julkaista. Ongelma jäi huomaamatta pitkään, koska usean vuoden käyttöajat eivät ole tyypillisiä palvelimille, jotka pitääkseen ajan tasalla pysyäkseen ajoittain uudelleenkäynnistetään ytimen päivitysten asentamiseksi tai käyttöjärjestelmän uuteen julkaisuun siirtymiseksi. Linux-jakelujen ei-uudelleenkäynnistysytimen päivitysmenetelmät sekä pitkät ylläpitojaksot (Ubuntu, RHEL ja SUSE ovat tuetut 10 vuoden ajan) voivat kuitenkin johtaa siihen, että palvelimia löydetään pitkään ilman uudelleenkäynnistystä.

Lähde: opennet.ru

Lisää kommentti