AMD EPYC 7002 процессорындағы қате 1044 күн жұмыс істегеннен кейін қатып қалады

2018 жылдан бері жеткізілген «Zen 7002» микроархитектурасына негізделген AMD EPYC 2 («Рим») серверлік процессорлар сериясында процессордың күйді қалпына келтірусіз (жүйені қайта жүктеу) 1044 күн жұмыс істегеннен кейін тұрып қалуына әкелетін қате бар. Мәселені блоктау үшін уақытша шешімдер ретінде CC6 қуатты үнемдеу режимін қолдауды өшіру немесе серверді 1044 күнде бір реттен жиі қайта қосу ұсынылады (шамамен 2 жыл 10 ай).

AMD жариялаған ақпаратқа сәйкес, тоқтап қалу процессордың ядросы CC6 қуатты үнемдеу режимінен оятуға тырысқанда (ядро-C6, бос тұрғанда кернеуді төмендетеді) таймер соңғы процессор күйін қалпына келтіргеннен кейін 1044 күндік мәнге жеткенде (көрініс уақыты REFCLK жиілігіне байланысты өзгеруі мүмкін) пайда болатын апатқа байланысты.

AMD ақаулық себебін егжей-тегжейлі түсіндіре алмайды. Reddit сайтында жарияланған болжамға сүйенсек, 2800 МГц жиілікте қалпына келтіргеннен кейін жұмыс циклдерінің санын есептейтін TSC (Time Stamp Counter) тізіліміндегі санауыш 0x380000000000000 мәніне жеткенде (2800 МГц *10. күн және 6 сағат).

Қатені түзету жарияланбайды. Мәселе ұзақ уақыт бойы байқалмады, өйткені көп жылдық жұмыс уақыты жаңартылып отыру үшін ядро ​​жаңартуларын орнату немесе операциялық жүйенің жаңа шығарылымына ауысу үшін мерзімді түрде қайта іске қосылуы қажет серверлер үшін тән емес. Дегенмен, Linux дистрибутивтерінің қайта жүктелмейтін ядроны жаңарту әдістері, сондай-ақ ұзақ техникалық қызмет көрсету циклдары (Ubuntu, RHEL және SUSE 10 жылға қолдау көрсетеді) серверлерді қайта жүктеусіз ұзақ уақыт бойы табуға әкелуі мүмкін.

Ақпарат көзі: opennet.ru

пікір қалдыру