Nag-freeze ang bug sa AMD EPYC 7002 CPU pagkatapos ng 1044 na araw ng operasyon

Ang AMD EPYC 2018 ("Rome") na serye ng mga server processor batay sa "Zen 7002" microarchitecture na ipinadala mula noong 2 ay may bug na nagiging sanhi ng pag-hang ng processor pagkatapos ng 1044 na araw ng operasyon nang walang state reset (system reboot). Bilang mga solusyon upang harangan ang isyu, inirerekomendang huwag paganahin ang CC6 power saving mode support o i-restart ang server nang higit sa isang beses bawat 1044 na araw (humigit-kumulang 2 taon 10 buwan).

Ayon sa impormasyong inilathala ng AMD, ang hang ay sanhi ng isang pag-crash na nangyayari kapag ang processor core ay sumusubok na gumising mula sa CC6 power-saving mode (core-C6, binabaan ang boltahe kapag idle) kapag ang timer ay umabot sa halaga ng 1044 araw pagkatapos ng huling pag-reset ng estado ng CPU (ang oras ng pagpapakita ay maaaring mag-iba depende sa frequency ng REFCLK).

Ang AMD ay hindi nagbibigay ng mas detalyadong paliwanag sa sanhi ng pagkabigo. Sa paghusga sa palagay na nai-publish sa Reddit, ang hang ay nangyayari kapag ang counter sa TSC (Time Stamp Counter) ay nagparehistro, na binibilang ang bilang ng mga cycle ng pagtatrabaho pagkatapos ng pag-reset, sa dalas ng 2800 MHz ay ​​umabot sa halagang 0x380000000000000 (2800 MHz * 10* *6 * 1042.5, ibig sabihin, pagkatapos ng 1042 araw at 12 oras).

Ang pag-aayos ng bug ay hindi maipa-publish. Ang problema ay nanatiling hindi napapansin sa loob ng mahabang panahon, dahil ang mga multi-year uptime ay hindi pangkaraniwan para sa mga server na, upang manatiling napapanahon, pana-panahong kailangang i-restart upang mag-install ng mga update sa kernel o lumipat sa isang bagong release ng operating system. Gayunpaman, ang mga non-reboot na pamamaraan ng pag-upgrade ng kernel ng Linux na hindi nagre-reboot at mahabang cycle ng pagpapanatili (Ubuntu, RHEL, at SUSE ay sinusuportahan ng 10 taon) ay maaaring humantong sa mahabang oras ng paghihintay para sa mga server nang hindi nagre-reboot.

Pinagmulan: opennet.ru

Magdagdag ng komento