Cimo en AMD EPYC 7002 CPU frostiĝas post 1044 tagoj da operacio

La serio AMD EPYC 2018 ("Romo") de servilaj procesoroj bazitaj sur la mikroarkitekturo "Zen 7002" sendita ekde 2 havas cimon, kiu igas la procesoron pendi post 1044 tagoj da funkciado sen ŝtatrestartigo (sistema rekomenco). Kiel solvoj por bloki la problemon, oni rekomendas malŝalti la subtenon de CC6-energioŝpara reĝimo aŭ rekomenci la servilon pli ol unufoje ĉiujn 1044 tagojn (ĉirkaŭ 2 jarojn 10 monatojn).

Laŭ informoj publikigitaj de AMD, la blokado estas kaŭzita de misfunkciado, kiu okazas kiam la procesoro-kerno provas vekiĝi de CC6-ŝpara reĝimo (kerno-C6, malaltigas la tension kiam neaktiva) kiam la tempigilo atingas la valoron de 1044 tagoj. post la lasta CPU-stato rekomencigita (la manifesttempo povas varii depende de la REFCLK-frekvenco).

AMD ne donas pli detalan klarigon pri la kaŭzo de la fiasko. Juĝante laŭ la supozo publikigita sur Reddit, la hang okazas kiam la nombrilo en la registro de TSC (Time Stamp Counter), kiu kalkulas la nombron da laborcikloj post rekomenciĝo, je ofteco de 2800 MHz atingas la valoron 0x380000000000000 (2800 MHz * 10*). *6 * 1042.5, t.e. post 1042 tagoj kaj 12 horoj).

La eraro korekto ne estos publikigita. La problemo restis nerimarkita dum longa tempo, ĉar plurjaraj ĝisdatigoj ne estas tipaj por serviloj kiuj, por teni ĝisdatigitaj, periode devas esti rekomencitaj por instali kernajn ĝisdatigojn aŭ por ŝanĝi al nova eldono de la operaciumo. Tamen, la metodoj de ĝisdatigo de la kerno ne-reboot de Linuksaj distribuaĵoj, same kiel longaj prizorgaj cikloj (Ubuntu, RHEL, kaj SUSE estas subtenataj dum 10 jaroj), povas rezultigi servilojn trovitajn dum longa tempo sen rekomenco.

fonto: opennet.ru

Aldoni komenton