AMD EPYC 7002 CPUలో బగ్ 1044 రోజుల ఆపరేషన్ తర్వాత ఘనీభవిస్తుంది

2018 నుండి డెలివరీ చేయబడిన AMD EPYC 7002 (“రోమ్”) సర్వర్ ప్రాసెసర్‌ల శ్రేణిలో, “జెన్ 2” మైక్రోఆర్కిటెక్చర్‌పై నిర్మించబడింది, దీని ఫలితంగా ప్రాసెసర్ 1044 రోజుల ఆపరేషన్ తర్వాత స్థితిని రీసెట్ చేయకుండా స్తంభింపజేస్తుంది ( సిస్టమ్ రీబూట్). సమస్యను నిరోధించడానికి ప్రత్యామ్నాయంగా, CC6 పవర్ సేవింగ్ మోడ్‌కు మద్దతుని నిలిపివేయడం లేదా సర్వర్‌ను ప్రతి 1044 రోజులకు ఒకసారి (సుమారు 2 సంవత్సరాల 10 నెలలు) కంటే ఎక్కువసార్లు రీబూట్ చేయడం సిఫార్సు చేయబడింది.

AMD ప్రచురించిన సమాచారం ప్రకారం, చివరి CPU తర్వాత 6 రోజుల తర్వాత టైమర్ చేరుకున్నప్పుడు ప్రాసెసర్ కోర్ CC6 పవర్-సేవింగ్ మోడ్ (కోర్-C1044, క్రియారహితంగా ఉన్నప్పుడు వోల్టేజ్‌ను తగ్గిస్తుంది) నుండి నిష్క్రమించడానికి ప్రయత్నించినప్పుడు సంభవించే వైఫల్యం కారణంగా హ్యాంగ్ ఏర్పడుతుంది. రీసెట్ (ఫ్రీక్వెన్సీ REFCLK ఆధారంగా ఇది సంభవించే సమయం మారవచ్చు).

AMD వైఫల్యానికి కారణం గురించి మరింత వివరణాత్మక వివరణను అందించదు. Redditలో ప్రచురించబడిన ఊహను బట్టి చూస్తే, TSC (టైమ్ స్టాంప్ కౌంటర్)లో కౌంటర్ రిజిస్టర్ అయినప్పుడు ఫ్రీజ్ ఏర్పడుతుంది, ఇది రీసెట్ చేసిన తర్వాత పని చక్రాల సంఖ్యను గణిస్తుంది, 2800 MHz ఫ్రీక్వెన్సీలో 0x380000000000000 (2800 MHz * 10 MHz * **6 * 1042.5, అంటే 1042 రోజులు మరియు 12 గంటల తర్వాత).

బగ్ పరిష్కారాన్ని ప్రచురించే ప్రణాళికలు లేవు. సర్వర్‌ల కోసం దీర్ఘ-కాల సమయ వ్యవధి విలక్షణమైనది కానందున సమస్య చాలా కాలం వరకు గుర్తించబడలేదు, వీటిని తాజాగా ఉంచడానికి, కెర్నల్ నవీకరణలను ఇన్‌స్టాల్ చేయడానికి లేదా ఆపరేటింగ్ సిస్టమ్ యొక్క కొత్త విడుదలకు తరలించడానికి క్రమానుగతంగా పునఃప్రారంభించబడాలి. అయినప్పటికీ, రీబూట్ చేయకుండానే కెర్నల్‌ను అప్‌డేట్ చేసే Linux డిస్ట్రిబ్యూషన్‌ల పద్ధతులు, అలాగే దీర్ఘకాల నిర్వహణ చక్రాలు (Ubuntu, RHEL మరియు SUSE 10 సంవత్సరాల పాటు సపోర్ట్ చేయబడుతున్నాయి), రీబూట్ చేయకుండా సర్వర్‌లు చాలా కాలం వెళ్లడానికి దారితీయవచ్చు.

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి