AMD EPYC 7002 CPU ನಲ್ಲಿನ ದೋಷವು 1044 ದಿನಗಳ ಕಾರ್ಯಾಚರಣೆಯ ನಂತರ ಫ್ರೀಜ್ ಆಗುತ್ತದೆ

2018 ರಿಂದ ಸಾಗಿಸಲಾದ "ಝೆನ್ 7002" ಮೈಕ್ರೊ ಆರ್ಕಿಟೆಕ್ಚರ್ ಆಧಾರಿತ ಸರ್ವರ್ ಪ್ರೊಸೆಸರ್‌ಗಳ ಎಎಮ್‌ಡಿ ಇಪಿವೈಸಿ 2 ("ರೋಮ್") ಸರಣಿಯು ದೋಷವನ್ನು ಹೊಂದಿದೆ, ಇದು ಸ್ಟೇಟ್ ರೀಸೆಟ್ (ಸಿಸ್ಟಮ್ ರೀಬೂಟ್) ಇಲ್ಲದೆ 1044 ದಿನಗಳ ಕಾರ್ಯಾಚರಣೆಯ ನಂತರ ಪ್ರೊಸೆಸರ್ ಸ್ಥಗಿತಗೊಳ್ಳಲು ಕಾರಣವಾಗುತ್ತದೆ. ಸಮಸ್ಯೆಯನ್ನು ತಡೆಯಲು ಪರಿಹಾರೋಪಾಯವಾಗಿ, CC6 ಪವರ್ ಸೇವಿಂಗ್ ಮೋಡ್ ಬೆಂಬಲವನ್ನು ನಿಷ್ಕ್ರಿಯಗೊಳಿಸಲು ಅಥವಾ ಪ್ರತಿ 1044 ದಿನಗಳಿಗಿಂತ ಹೆಚ್ಚು ಬಾರಿ ಸರ್ವರ್ ಅನ್ನು ಮರುಪ್ರಾರಂಭಿಸಲು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ (ಅಂದಾಜು 2 ವರ್ಷಗಳು 10 ತಿಂಗಳುಗಳು).

AMD ಪ್ರಕಟಿಸಿದ ಮಾಹಿತಿಯ ಪ್ರಕಾರ, ಕೊನೆಯ CPU ಸ್ಥಿತಿಯನ್ನು ಮರುಹೊಂದಿಸಿದ ನಂತರ ಟೈಮರ್ 6 ದಿನಗಳ ಮೌಲ್ಯವನ್ನು ತಲುಪಿದಾಗ ಪ್ರೊಸೆಸರ್ ಕೋರ್ CC6 ಪವರ್-ಸೇವಿಂಗ್ ಮೋಡ್‌ನಿಂದ (ಕೋರ್-C1044, ಐಡಲ್‌ನಲ್ಲಿ ವೋಲ್ಟೇಜ್ ಅನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ) ಎಚ್ಚರಗೊಳ್ಳಲು ಪ್ರಯತ್ನಿಸಿದಾಗ ಸಂಭವಿಸುವ ಕ್ರ್ಯಾಶ್‌ನಿಂದ ಹ್ಯಾಂಗ್ ಉಂಟಾಗುತ್ತದೆ (REFCLK ಆವರ್ತನವನ್ನು ಅವಲಂಬಿಸಿ ಅಭಿವ್ಯಕ್ತಿ ಸಮಯವು ಬದಲಾಗಬಹುದು).

ವೈಫಲ್ಯದ ಕಾರಣದ ಬಗ್ಗೆ ಹೆಚ್ಚು ವಿವರವಾದ ವಿವರಣೆಯನ್ನು AMD ಒದಗಿಸುವುದಿಲ್ಲ. ರೆಡ್ಡಿಟ್‌ನಲ್ಲಿ ಪೋಸ್ಟ್ ಮಾಡಲಾದ ಊಹೆಯ ಮೂಲಕ ನಿರ್ಣಯಿಸುವುದು, TSC (ಟೈಮ್ ಸ್ಟ್ಯಾಂಪ್ ಕೌಂಟರ್) ರಿಜಿಸ್ಟರ್‌ನಲ್ಲಿ ಕೌಂಟರ್ ಸಂಭವಿಸಿದಾಗ, ಮರುಹೊಂದಿಸಿದ ನಂತರ ವರ್ಕಿಂಗ್ ಸೈಕಲ್‌ಗಳ ಸಂಖ್ಯೆಯನ್ನು ಎಣಿಸುವಾಗ, 2800 MHz ಆವರ್ತನದಲ್ಲಿ 0x380000000000000 ಮೌಲ್ಯವನ್ನು ತಲುಪುತ್ತದೆ (2800 MHz 10 ನಂತರ *6*1042.5e.1042 ದಿನಗಳು ಮತ್ತು 12 ಗಂಟೆಗಳು).

ದೋಷ ಪರಿಹಾರವನ್ನು ಪ್ರಕಟಿಸಲು ಹೋಗುತ್ತಿಲ್ಲ. ಬಹು-ವರ್ಷದ ಅಪ್‌ಟೈಮ್‌ಗಳು ಸರ್ವರ್‌ಗಳಿಗೆ ವಿಶಿಷ್ಟವಲ್ಲದ ಕಾರಣ, ಸಮಸ್ಯೆಯು ದೀರ್ಘಕಾಲದವರೆಗೆ ಗಮನಕ್ಕೆ ಬರಲಿಲ್ಲ, ಅದು ನವೀಕೃತವಾಗಿರಲು, ಕರ್ನಲ್ ನವೀಕರಣಗಳನ್ನು ಸ್ಥಾಪಿಸಲು ಅಥವಾ ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್‌ನ ಹೊಸ ಬಿಡುಗಡೆಗೆ ಬದಲಾಯಿಸಲು ನಿಯತಕಾಲಿಕವಾಗಿ ಮರುಪ್ರಾರಂಭಿಸಬೇಕಾಗುತ್ತದೆ. ಆದಾಗ್ಯೂ, Linux ವಿತರಣೆಗಳ ರೀಬೂಟ್ ಅಲ್ಲದ ಕರ್ನಲ್ ಅಪ್‌ಗ್ರೇಡ್ ವಿಧಾನಗಳು ಮತ್ತು ದೀರ್ಘ ನಿರ್ವಹಣಾ ಚಕ್ರಗಳು (ಉಬುಂಟು, RHEL, ಮತ್ತು SUSE ಅನ್ನು 10 ವರ್ಷಗಳು ಬೆಂಬಲಿಸುತ್ತವೆ) ರೀಬೂಟ್ ಮಾಡದೆಯೇ ಸರ್ವರ್‌ಗಳಿಗೆ ದೀರ್ಘ ಕಾಯುವಿಕೆಗೆ ಕಾರಣವಾಗಬಹುದು.

ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ