Bug fl-AMD EPYC 7002 CPU jiffriża wara 1044 jum ta 'tħaddim

Fis-serje AMD EPYC 2018 ("Ruma") ta 'proċessuri tas-server ikkunsinnati mill-7002, mibnija fuq il-mikroarkitettura "Zen 2", ġie identifikat żball li b'riżultat tiegħu l-proċessur jiffriża wara 1044 jum ta' tħaddim mingħajr ma jerġa 'jissettja l-istat ( reboot tas-sistema). Bħala soluzzjoni biex timblokka l-problema, huwa rakkomandat li tiddiżattiva l-appoġġ għall-modalità tal-iffrankar tal-enerġija CC6 jew terġa 'tibda s-server aktar minn darba kull 1044 jum (madwar 2 snin 10 xhur).

Skont informazzjoni ppubblikata minn AMD, il-hang huwa kkawżat minn glitch li jseħħ meta l-qalba tal-proċessur tipprova toħroġ mill-modalità li tiffranka l-enerġija CC6 (qalba-C6, tnaqqas il-vultaġġ meta inattiv) meta t-tajmer jilħaq 1044 jum wara l-aħħar CPU reset (il-ħin li jseħħ jista' jvarja skond mill-frekwenza REFCLK).

AMD ma tipprovdix spjegazzjoni aktar dettaljata tal-kawża tal-falliment. Ġġudikat mill-assunzjoni ppubblikata fuq Reddit, friża sseħħ meta l-counter fir-reġistru TSC (Time Stamp Counter), li jgħodd in-numru ta 'ċikli ta' xogħol wara reset, bi frekwenza ta '2800 MHz jilħaq il-valur 0x380000000000000 (2800 MHz * 10 **6 * 1042.5, jiġifieri wara 1042 jum u 12-il siegħa).

M'hemm l-ebda pjan biex tippubblika bug fix. Il-problema baqgħet inosservata għal żmien twil peress li l-uptime fit-tul mhuwiex tipiku għas-servers, li, sabiex jinżammu aġġornati, għandhom jerġgħu jinbdew perjodikament biex jiġu installati aġġornamenti tal-kernel jew biex jemigraw għal rilaxx ġdid tas-sistema operattiva. Madankollu, il-metodi tad-distribuzzjonijiet Linux biex jaġġornaw il-kernel mingħajr rebooting, kif ukoll ċikli twal ta 'manutenzjoni (Ubuntu, RHEL u SUSE huma appoġġjati għal 10 snin), jistgħu jwasslu biex is-servers imorru għal żmien twil mingħajr reboot.

Sors: opennet.ru

Żid kumment