Bug dina AMD EPYC 7002 CPU freezes sanggeus 1044 poé operasi

Séri prosesor server AMD EPYC 2018 ("Roma") dumasar kana microarchitecture "Zen 7002" anu dikirim saprak 2 ngagaduhan bug anu nyababkeun prosésor ngagantung saatos 1044 dinten operasi tanpa reset kaayaan (sistem reboot). Salaku workarounds pikeun meungpeuk masalah, eta disarankeun pikeun mareuman CC6 rojongan mode hemat daya atawa balikan deui server leuwih ti sakali unggal 1044 poé (kira-kira 2 taun 10 bulan).

Numutkeun inpormasi anu diterbitkeun ku AMD, hang disababkeun ku kacilakaan anu lumangsung nalika inti prosésor nyobian hudang tina mode hemat daya CC6 (inti-C6, nurunkeun tegangan nalika dianggurkeun) nalika timer ngahontal nilai 1044 dinten saatos. reset kaayaan CPU panungtungan (waktu manifestasi bisa rupa-rupa gumantung kana frékuénsi REFCLK).

AMD henteu masihan katerangan anu langkung rinci ngeunaan anu nyababkeun gagalna. Ditilik ku asumsi diterbitkeun dina Reddit, hang lumangsung nalika counter di TSC (Time Stamp Counter) ngadaptar, nu diitung jumlah siklus gawé sanggeus reset, dina frékuénsi 2800 MHz ngahontal nilai 0x380000000000000 (2800 MHz * 10). **6 * 1042.5, nyaéta saatos 1042 dinten sareng 12 jam).

Perbaikan bug moal diterbitkeun. Masalahna tetep teu dipikanyaho pikeun waktos anu lami, sabab waktos multi-taun henteu khas pikeun server anu, supados tetep diropéa, périodik kedah di-restart pikeun masang apdet kernel atanapi ngalih ka sékrési sistem operasi énggal. Sanajan kitu, panyebaran Linux Ubuntu métode pamutahiran kernel non-reboot, kitu ogé siklus pangropéa panjang (Ubuntu, RHEL, jeung SUSE dirojong ku 10 taun), bisa ngakibatkeun server kapanggih keur lila tanpa reboot a.

sumber: opennet.ru

Tambahkeun komentar