AMD EPYC 7002 CPU ۾ بگ 1044 ڏينهن جي آپريشن کان پوءِ منجمد ٿي ويو

AMD EPYC 2018 ("روم") سرور پروسيسرز جو سلسلو "زين 7002" مائڪرو آرڪيٽيڪچر جي بنياد تي 2 کان موڪليو ويو آهي هڪ بگ آهي جيڪو پروسيسر کي 1044 ڏينهن جي آپريشن کان پوءِ بغير ڪنهن اسٽيٽ ري سيٽ (سسٽم ريبوٽ) جي لٽڻ جو سبب بڻائيندو آهي. جيئن مسئلي کي بلاڪ ڪرڻ لاءِ ڪم ڪار جي طور تي، اها سفارش ڪئي وئي آهي ته CC6 پاور سيونگ موڊ سپورٽ کي غير فعال ڪيو وڃي يا هر 1044 ڏينهن ۾ هڪ ڀيرو کان وڌيڪ سرور کي ٻيهر شروع ڪيو وڃي (تقريبن 2 سال 10 مهينا).

AMD پاران جاري ڪيل معلومات موجب، هينگ هڪ خرابي جي ڪري ٿئي ٿي جيڪا تڏهن ٿيندي آهي جڏهن پروسيسر ڪور CC6 پاور-سيونگ موڊ (core-C6، وولٽيج کي گهٽ ڪري ٿو جڏهن بيڪار هجي) جڏهن ٽائمر 1044 ڏينهن جي قيمت تي پهچي ٿو. آخري سي پي يو اسٽيٽ ري سيٽ ٿيڻ کان پوءِ (ظاھر ڪرڻ جو وقت مختلف ٿي سگھي ٿو REFCLK فریکوئنسي جي لحاظ کان).

AMD ناڪامي جي سبب جي وڌيڪ تفصيلي وضاحت فراهم نٿو ڪري. Reddit تي شايع ٿيل مفروضي جي مطابق، هينگ تڏهن ٿئي ٿي جڏهن TSC (Time Stamp Counter) رجسٽر ۾ ڪائونٽر، جيڪو ڳڻپ ڪري ٿو ڪم ڪندڙ چڪرن جو تعداد ري سيٽ ڪرڻ کان پوءِ، 2800 MHz جي فريڪوئنسي تي 0x380000000000000 (2800MHz*10) قدر تائين پهچي ٿو. *6 * 1042.5، يعني 1042 ڏينهن ۽ 12 ڪلاڪن کان پوءِ).

بگ فڪس شايع ٿيڻ وارو ناهي. اهو مسئلو گهڻي وقت تائين اڻڄاتل رهيو، ڇاڪاڻ ته گهڻن سالن جي اپٽائمز سرورز لاءِ عام نه هونديون آهن، جن کي اپڊيٽ رکڻ لاءِ، وقتي طور تي ڪنيل اپڊيٽس کي انسٽال ڪرڻ يا آپريٽنگ سسٽم جي نئين رليز تي سوئچ ڪرڻ لاءِ ٻيهر شروع ڪرڻو پوندو. بهرحال، لينڪس ڊسٽريبيوشن جي غير ريبوٽ ڪنييل اپ گريڊ طريقا، گڏوگڏ ڊگھي سار سنڀال واري چڪر (Ubuntu، RHEL، ۽ SUSE 10 سالن لاءِ سپورٽ ٿيل آهن)، نتيجي ۾ ٿي سگهي ٿو سرور ڊگهي عرصي تائين بغير ريبوٽ جي.

جو ذريعو: opennet.ru

تبصرو شامل ڪريو