Un bogue dans le CPU AMD EPYC 7002 se bloque après 1044 jours de fonctionnement

La série de processeurs de serveur AMD EPYC 2018 ("Rome") basée sur la microarchitecture "Zen 7002" livrée depuis 2 présente un bogue qui provoque le blocage du processeur après 1044 jours de fonctionnement sans réinitialisation d'état (redémarrage du système). Comme solutions de contournement pour bloquer le problème, il est recommandé de désactiver la prise en charge du mode d'économie d'énergie CC6 ou de redémarrer le serveur plus d'une fois tous les 1044 jours (environ 2 ans 10 mois).

Selon les informations publiées par AMD, le blocage est causé par un crash qui se produit lorsque le cœur du processeur tente de se réveiller du mode d'économie d'énergie CC6 (core-C6, abaisse la tension en cas d'inactivité) lorsque la minuterie atteint la valeur de 1044 jours après la dernière réinitialisation de l'état du processeur (le temps de manifestation peut varier en fonction de la fréquence REFCLK).

AMD ne fournit pas d'explication plus détaillée sur la cause de la panne. A en juger par l'hypothèse publiée sur Reddit, le blocage se produit lorsque le compteur du registre TSC (Time Stamp Counter), qui compte le nombre de cycles de travail après une réinitialisation, à une fréquence de 2800 MHz atteint la valeur 0x380000000000000 (2800 MHz * 10 **6 * 1042.5, soit après 1042 jours et 12 heures).

Le correctif de bug ne sera pas publié. Le problème est resté longtemps inaperçu, car les temps de disponibilité pluriannuels ne sont pas typiques pour les serveurs qui, pour se tenir à jour, doivent périodiquement être redémarrés pour installer les mises à jour du noyau ou pour passer à une nouvelle version du système d'exploitation. Cependant, les méthodes de mise à niveau du noyau sans redémarrage des distributions Linux, ainsi que les longs cycles de maintenance (Ubuntu, RHEL et SUSE sont soutenus par 10 ans), peuvent entraîner la recherche de serveurs pendant une longue période sans redémarrage.

Source: opennet.ru

Ajouter un commentaire