AMD EPYC 7002 CPU میں بگ 1044 دن کے آپریشن کے بعد منجمد ہو جاتا ہے

2018 سے بھیجے گئے "Zen 7002" مائیکرو آرکیٹیکچر پر مبنی سرور پروسیسرز کی AMD EPYC 2 ("روم") سیریز میں ایک بگ ہے جس کی وجہ سے پروسیسر 1044 دنوں کے آپریشن کے بعد اسٹیٹ ری سیٹ (سسٹم ریبوٹ) کے بغیر لٹک جاتا ہے۔ مسئلے کو روکنے کے لیے کام کے طور پر، CC6 پاور سیونگ موڈ سپورٹ کو غیر فعال کرنے یا ہر 1044 دنوں میں ایک سے زیادہ بار سرور کو دوبارہ شروع کرنے کی سفارش کی جاتی ہے (تقریباً 2 سال 10 ماہ)۔

AMD کی طرف سے جاری کردہ معلومات کے مطابق، ہینگ ایک خرابی کی وجہ سے ہوتی ہے جو اس وقت ہوتی ہے جب پروسیسر کور CC6 پاور سیونگ موڈ (core-C6، بیکار ہونے پر وولٹیج کو کم کرتا ہے) سے اٹھنے کی کوشش کرتا ہے جب ٹائمر 1044 دنوں کی قدر تک پہنچ جاتا ہے۔ آخری سی پی یو اسٹیٹ ری سیٹ کے بعد (ری ایف سی ایل کے فریکوئنسی کے لحاظ سے ظاہر ہونے کا وقت مختلف ہوسکتا ہے)۔

AMD ناکامی کی وجہ کی مزید تفصیلی وضاحت فراہم نہیں کرتا ہے۔ Reddit پر شائع ہونے والے مفروضے کو دیکھتے ہوئے، ہینگ اس وقت ہوتی ہے جب TSC (ٹائم اسٹیمپ کاؤنٹر) رجسٹر میں کاؤنٹر، جو ری سیٹ کے بعد ورکنگ سائیکلوں کی تعداد کو شمار کرتا ہے، 2800 میگاہرٹز کی فریکوئنسی پر 0x380000000000000 (2800MHz*10) قدر تک پہنچ جاتا ہے۔ *6 * 1042.5، یعنی 1042 دن اور 12 گھنٹے کے بعد)۔

بگ فکس شائع نہیں ہونے جا رہا ہے۔ مسئلہ ایک طویل عرصے تک کسی کا دھیان نہیں رہا، کیونکہ سرورز کے لیے کثیر سالہ اپ ٹائمز عام نہیں ہیں جنہیں اپ ٹو ڈیٹ رکھنے کے لیے، کرنل اپ ڈیٹس کو انسٹال کرنے یا آپریٹنگ سسٹم کے نئے ریلیز پر سوئچ کرنے کے لیے وقتاً فوقتاً دوبارہ شروع کرنا پڑتا ہے۔ تاہم، لینکس ڈسٹری بیوشنز کے نان ریبوٹ کرنل اپ گریڈ کے طریقے، نیز طویل دیکھ بھال کے چکر (اوبنٹو، RHEL، اور SUSE 10 سال کے لیے تعاون یافتہ ہیں) کے نتیجے میں سرورز طویل عرصے تک بغیر کسی ریبوٹ کے مل سکتے ہیں۔

ماخذ: opennet.ru

نیا تبصرہ شامل کریں