ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

Prometheus 2 ರಲ್ಲಿನ ಸಮಯ ಸರಣಿ ಡೇಟಾಬೇಸ್ (TSDB) ಎಂಜಿನಿಯರಿಂಗ್ ಪರಿಹಾರದ ಅತ್ಯುತ್ತಮ ಉದಾಹರಣೆಯಾಗಿದೆ, ಇದು ಡೇಟಾ ಸಂಗ್ರಹಣೆ ವೇಗ, ಪ್ರಶ್ನೆ ಕಾರ್ಯಗತಗೊಳಿಸುವಿಕೆ ಮತ್ತು ಸಂಪನ್ಮೂಲ ದಕ್ಷತೆಯ ವಿಷಯದಲ್ಲಿ ಪ್ರೊಮೀಥಿಯಸ್ 2 ನಲ್ಲಿನ v1 ಸಂಗ್ರಹಣೆಯ ಮೇಲೆ ಪ್ರಮುಖ ಸುಧಾರಣೆಗಳನ್ನು ನೀಡುತ್ತದೆ. ನಾವು ಪರ್ಕೋನಾ ಮಾನಿಟರಿಂಗ್ ಮತ್ತು ಮ್ಯಾನೇಜ್ಮೆಂಟ್ (PMM) ನಲ್ಲಿ Prometheus 2 ಅನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸುತ್ತಿದ್ದೇವೆ ಮತ್ತು Prometheus 2 TSDB ಯ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ನನಗೆ ಅವಕಾಶವಿತ್ತು. ಈ ಲೇಖನದಲ್ಲಿ ನಾನು ಈ ಅವಲೋಕನಗಳ ಫಲಿತಾಂಶಗಳ ಬಗ್ಗೆ ಮಾತನಾಡುತ್ತೇನೆ.

ಸರಾಸರಿ ಪ್ರಮೀತಿಯಸ್ ಕೆಲಸದ ಹೊರೆ

ಸಾಮಾನ್ಯ ಉದ್ದೇಶದ ಡೇಟಾಬೇಸ್‌ಗಳೊಂದಿಗೆ ವ್ಯವಹರಿಸಲು ಬಳಸುವವರಿಗೆ, ವಿಶಿಷ್ಟವಾದ ಪ್ರಮೀತಿಯಸ್ ಕೆಲಸದ ಹೊರೆ ಸಾಕಷ್ಟು ಆಸಕ್ತಿದಾಯಕವಾಗಿದೆ. ಡೇಟಾ ಸಂಗ್ರಹಣೆಯ ದರವು ಸ್ಥಿರವಾಗಿರುತ್ತದೆ: ಸಾಮಾನ್ಯವಾಗಿ ನೀವು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುವ ಸೇವೆಗಳು ಸರಿಸುಮಾರು ಅದೇ ಸಂಖ್ಯೆಯ ಮೆಟ್ರಿಕ್‌ಗಳನ್ನು ಕಳುಹಿಸುತ್ತವೆ ಮತ್ತು ಮೂಲಸೌಕರ್ಯವು ತುಲನಾತ್ಮಕವಾಗಿ ನಿಧಾನವಾಗಿ ಬದಲಾಗುತ್ತದೆ.
ಮಾಹಿತಿಗಾಗಿ ವಿನಂತಿಗಳು ವಿವಿಧ ಮೂಲಗಳಿಂದ ಬರಬಹುದು. ಅವುಗಳಲ್ಲಿ ಕೆಲವು, ಉದಾಹರಣೆಗೆ ಎಚ್ಚರಿಕೆಗಳು, ಸ್ಥಿರ ಮತ್ತು ಊಹಿಸಬಹುದಾದ ಮೌಲ್ಯಕ್ಕಾಗಿ ಶ್ರಮಿಸುತ್ತವೆ. ಬಳಕೆದಾರರ ವಿನಂತಿಗಳಂತಹ ಇತರವುಗಳು ಸ್ಫೋಟಗಳನ್ನು ಉಂಟುಮಾಡಬಹುದು, ಆದಾಗ್ಯೂ ಹೆಚ್ಚಿನ ಕೆಲಸದ ಹೊರೆಗಳಿಗೆ ಇದು ಅಲ್ಲ.

ಲೋಡ್ ಪರೀಕ್ಷೆ

ಪರೀಕ್ಷೆಯ ಸಮಯದಲ್ಲಿ, ನಾನು ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವ ಸಾಮರ್ಥ್ಯದ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿದೆ. ನಾನು ಈ ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಲಿನೋಡ್ ಸೇವೆಯಲ್ಲಿ Go 2.3.2 (PMM 1.10.1 ರ ಭಾಗವಾಗಿ) ನೊಂದಿಗೆ ಸಂಕಲಿಸಿದ Prometheus 1.14 ಅನ್ನು ನಿಯೋಜಿಸಿದೆ: ಸ್ಟಾಕ್‌ಸ್ಕ್ರಿಪ್ಟ್. ಅತ್ಯಂತ ವಾಸ್ತವಿಕ ಲೋಡ್ ಉತ್ಪಾದನೆಗೆ, ಇದನ್ನು ಬಳಸಿ ಸ್ಟಾಕ್‌ಸ್ಕ್ರಿಪ್ಟ್ ನಾನು ಹಲವಾರು MySQL ನೋಡ್‌ಗಳನ್ನು ನೈಜ ಲೋಡ್‌ನೊಂದಿಗೆ (Sysbench TPC-C ಟೆಸ್ಟ್) ಪ್ರಾರಂಭಿಸಿದೆ, ಪ್ರತಿಯೊಂದೂ 10 Linux/MySQL ನೋಡ್‌ಗಳನ್ನು ಅನುಕರಿಸುತ್ತದೆ.
ಈ ಕೆಳಗಿನ ಎಲ್ಲಾ ಪರೀಕ್ಷೆಗಳನ್ನು ಎಂಟು ವರ್ಚುವಲ್ ಕೋರ್‌ಗಳು ಮತ್ತು 32 GB ಮೆಮೊರಿಯೊಂದಿಗೆ ಲಿನೋಡ್ ಸರ್ವರ್‌ನಲ್ಲಿ ನಡೆಸಲಾಯಿತು, ಇನ್ನೂರು MySQL ನಿದರ್ಶನಗಳನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುವ 20 ಲೋಡ್ ಸಿಮ್ಯುಲೇಶನ್‌ಗಳನ್ನು ರನ್ ಮಾಡಲಾಗಿದೆ. ಅಥವಾ, ಪ್ರಮೀತಿಯಸ್ ಪರಿಭಾಷೆಯಲ್ಲಿ, 800 ಗುರಿಗಳು, ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ 440 ಸ್ಕ್ರ್ಯಾಪ್‌ಗಳು, ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ 380 ಸಾವಿರ ದಾಖಲೆಗಳು ಮತ್ತು 1,7 ಮಿಲಿಯನ್ ಸಕ್ರಿಯ ಸಮಯದ ಸರಣಿಗಳು.

ಡಿಸೈನ್

ಸಾಂಪ್ರದಾಯಿಕ ಡೇಟಾಬೇಸ್‌ಗಳ ಸಾಮಾನ್ಯ ವಿಧಾನವೆಂದರೆ, ಪ್ರೊಮೆಥಿಯಸ್ 1.x ಬಳಸಿದ ವಿಧಾನವನ್ನು ಒಳಗೊಂಡಂತೆ ಮೆಮೊರಿ ಮಿತಿ. ಲೋಡ್ ಅನ್ನು ನಿರ್ವಹಿಸಲು ಇದು ಸಾಕಾಗದಿದ್ದರೆ, ನೀವು ಹೆಚ್ಚಿನ ಲೇಟೆನ್ಸಿಗಳನ್ನು ಅನುಭವಿಸುವಿರಿ ಮತ್ತು ಕೆಲವು ವಿನಂತಿಗಳು ವಿಫಲಗೊಳ್ಳುತ್ತವೆ. ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ ಮೆಮೊರಿ ಬಳಕೆಯನ್ನು ಕೀ ಮೂಲಕ ಕಾನ್ಫಿಗರ್ ಮಾಡಬಹುದು storage.tsdb.min-block-duration, ಡಿಸ್ಕ್‌ಗೆ ಫ್ಲಶ್ ಮಾಡುವ ಮೊದಲು ರೆಕಾರ್ಡಿಂಗ್‌ಗಳನ್ನು ಎಷ್ಟು ಸಮಯದವರೆಗೆ ಮೆಮೊರಿಯಲ್ಲಿ ಇರಿಸಲಾಗುತ್ತದೆ ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸುತ್ತದೆ (ಡೀಫಾಲ್ಟ್ 2 ಗಂಟೆಗಳು). ಅಗತ್ಯವಿರುವ ಮೆಮೊರಿಯ ಪ್ರಮಾಣವು ನಿವ್ವಳ ಒಳಬರುವ ಸ್ಟ್ರೀಮ್‌ಗೆ ಸೇರಿಸಲಾದ ಸಮಯ ಸರಣಿಗಳು, ಲೇಬಲ್‌ಗಳು ಮತ್ತು ಸ್ಕ್ರ್ಯಾಪ್‌ಗಳ ಸಂಖ್ಯೆಯನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ. ಡಿಸ್ಕ್ ಜಾಗದ ವಿಷಯದಲ್ಲಿ, ಪ್ರಮೀತಿಯಸ್ ಪ್ರತಿ ದಾಖಲೆಗೆ 3 ಬೈಟ್‌ಗಳನ್ನು (ಮಾದರಿ) ಬಳಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದ್ದಾನೆ. ಮತ್ತೊಂದೆಡೆ, ಮೆಮೊರಿ ಅಗತ್ಯತೆಗಳು ಹೆಚ್ಚು.

ಬ್ಲಾಕ್ ಗಾತ್ರವನ್ನು ಕಾನ್ಫಿಗರ್ ಮಾಡಲು ಸಾಧ್ಯವಾದರೂ, ಅದನ್ನು ಹಸ್ತಚಾಲಿತವಾಗಿ ಕಾನ್ಫಿಗರ್ ಮಾಡಲು ಶಿಫಾರಸು ಮಾಡುವುದಿಲ್ಲ, ಆದ್ದರಿಂದ ನಿಮ್ಮ ಕೆಲಸದ ಹೊರೆಗೆ ಅಗತ್ಯವಿರುವಷ್ಟು ಮೆಮೊರಿಯನ್ನು ಪ್ರಮೀಥಿಯಸ್ಗೆ ನೀಡಲು ನೀವು ಒತ್ತಾಯಿಸಲ್ಪಡುತ್ತೀರಿ.
ಮೆಟ್ರಿಕ್‌ಗಳ ಒಳಬರುವ ಸ್ಟ್ರೀಮ್ ಅನ್ನು ಬೆಂಬಲಿಸಲು ಸಾಕಷ್ಟು ಮೆಮೊರಿ ಇಲ್ಲದಿದ್ದರೆ, ಪ್ರಮೀತಿಯಸ್ ಮೆಮೊರಿಯಿಂದ ಹೊರಬರುತ್ತಾನೆ ಅಥವಾ OOM ಕೊಲೆಗಾರ ಅದನ್ನು ಪಡೆಯುತ್ತಾನೆ.
ಪ್ರಮೀತಿಯಸ್ ಮೆಮೊರಿ ಖಾಲಿಯಾದಾಗ ಕ್ರ್ಯಾಶ್ ಅನ್ನು ವಿಳಂಬಗೊಳಿಸಲು ಸ್ವಾಪ್ ಅನ್ನು ಸೇರಿಸುವುದು ನಿಜವಾಗಿಯೂ ಸಹಾಯ ಮಾಡುವುದಿಲ್ಲ, ಏಕೆಂದರೆ ಈ ಕಾರ್ಯವನ್ನು ಬಳಸುವುದರಿಂದ ಸ್ಫೋಟಕ ಮೆಮೊರಿ ಬಳಕೆಗೆ ಕಾರಣವಾಗುತ್ತದೆ. ಇದು ಗೋ, ಅದರ ಕಸ ಸಂಗ್ರಾಹಕ ಮತ್ತು ಸ್ವಾಪ್‌ನೊಂದಿಗೆ ವ್ಯವಹರಿಸುವ ವಿಧಾನದೊಂದಿಗೆ ಸಂಬಂಧಿಸಿದೆ ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ.
ಮತ್ತೊಂದು ಆಸಕ್ತಿದಾಯಕ ವಿಧಾನವೆಂದರೆ ಹೆಡ್ ಬ್ಲಾಕ್ ಅನ್ನು ಪ್ರಕ್ರಿಯೆಯ ಪ್ರಾರಂಭದಿಂದ ಎಣಿಸುವ ಬದಲು ನಿರ್ದಿಷ್ಟ ಸಮಯದಲ್ಲಿ ಡಿಸ್ಕ್‌ಗೆ ಫ್ಲಶ್ ಮಾಡಲು ಕಾನ್ಫಿಗರ್ ಮಾಡುವುದು.

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ನೀವು ಗ್ರಾಫ್‌ನಿಂದ ನೋಡುವಂತೆ, ಪ್ರತಿ ಎರಡು ಗಂಟೆಗಳಿಗೊಮ್ಮೆ ಡಿಸ್ಕ್‌ಗೆ ಫ್ಲಶ್‌ಗಳು ಸಂಭವಿಸುತ್ತವೆ. ನೀವು ನಿಮಿಷ-ಬ್ಲಾಕ್-ಅವಧಿಯ ನಿಯತಾಂಕವನ್ನು ಒಂದು ಗಂಟೆಗೆ ಬದಲಾಯಿಸಿದರೆ, ಈ ಮರುಹೊಂದಿಕೆಗಳು ಪ್ರತಿ ಗಂಟೆಗೆ ಸಂಭವಿಸುತ್ತವೆ, ಅರ್ಧ ಘಂಟೆಯ ನಂತರ ಪ್ರಾರಂಭವಾಗುತ್ತದೆ.
ನಿಮ್ಮ ಪ್ರಮೀತಿಯಸ್ ಸ್ಥಾಪನೆಯಲ್ಲಿ ಇದನ್ನು ಮತ್ತು ಇತರ ಗ್ರಾಫ್‌ಗಳನ್ನು ಬಳಸಲು ನೀವು ಬಯಸಿದರೆ, ನೀವು ಇದನ್ನು ಬಳಸಬಹುದು ಡ್ಯಾಶ್ಬೋರ್ಡ್. ಇದನ್ನು PMM ಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ ಆದರೆ, ಸಣ್ಣ ಮಾರ್ಪಾಡುಗಳೊಂದಿಗೆ, ಯಾವುದೇ ಪ್ರಮೀತಿಯಸ್ ಸ್ಥಾಪನೆಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ.
ನಾವು ಮೆಮೊರಿಯಲ್ಲಿ ಸಂಗ್ರಹವಾಗಿರುವ ಹೆಡ್ ಬ್ಲಾಕ್ ಎಂಬ ಸಕ್ರಿಯ ಬ್ಲಾಕ್ ಅನ್ನು ಹೊಂದಿದ್ದೇವೆ; ಹಳೆಯ ಡೇಟಾವನ್ನು ಹೊಂದಿರುವ ಬ್ಲಾಕ್‌ಗಳು ಮೂಲಕ ಲಭ್ಯವಿದೆ mmap(). ಇದು ಸಂಗ್ರಹವನ್ನು ಪ್ರತ್ಯೇಕವಾಗಿ ಕಾನ್ಫಿಗರ್ ಮಾಡುವ ಅಗತ್ಯವನ್ನು ನಿವಾರಿಸುತ್ತದೆ, ಆದರೆ ಹೆಡ್ ಬ್ಲಾಕ್ ಅನ್ನು ಸರಿಹೊಂದಿಸುವುದಕ್ಕಿಂತ ಹಳೆಯದಾದ ಡೇಟಾವನ್ನು ನೀವು ಪ್ರಶ್ನಿಸಲು ಬಯಸಿದರೆ ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್ ಸಂಗ್ರಹಕ್ಕಾಗಿ ನೀವು ಸಾಕಷ್ಟು ಜಾಗವನ್ನು ಬಿಡಬೇಕಾಗುತ್ತದೆ ಎಂದರ್ಥ.
ಇದರರ್ಥ ಪ್ರಮೀತಿಯಸ್ ವರ್ಚುವಲ್ ಮೆಮೊರಿ ಬಳಕೆ ಸಾಕಷ್ಟು ಹೆಚ್ಚು ಕಾಣುತ್ತದೆ, ಇದು ಚಿಂತಿಸಬೇಕಾದ ವಿಷಯವಲ್ಲ.

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ಮತ್ತೊಂದು ಆಸಕ್ತಿದಾಯಕ ವಿನ್ಯಾಸದ ಅಂಶವೆಂದರೆ WAL ಬಳಕೆ (ಮುಂದೆ ಬರೆಯಿರಿ). ಶೇಖರಣಾ ದಾಖಲಾತಿಯಿಂದ ನೀವು ನೋಡುವಂತೆ, ಪ್ರಮೀತಿಯಸ್ ಕ್ರ್ಯಾಶ್‌ಗಳನ್ನು ತಪ್ಪಿಸಲು WAL ಅನ್ನು ಬಳಸುತ್ತಾರೆ. ಡೇಟಾ ಬದುಕುಳಿಯುವಿಕೆಯನ್ನು ಖಾತರಿಪಡಿಸುವ ನಿರ್ದಿಷ್ಟ ಕಾರ್ಯವಿಧಾನಗಳು, ದುರದೃಷ್ಟವಶಾತ್, ಉತ್ತಮವಾಗಿ ದಾಖಲಿಸಲ್ಪಟ್ಟಿಲ್ಲ. Prometheus ಆವೃತ್ತಿ 2.3.2 ಪ್ರತಿ 10 ಸೆಕೆಂಡಿಗೆ WAL ಅನ್ನು ಡಿಸ್ಕ್‌ಗೆ ಫ್ಲಶ್ ಮಾಡುತ್ತದೆ ಮತ್ತು ಈ ಆಯ್ಕೆಯು ಬಳಕೆದಾರರನ್ನು ಕಾನ್ಫಿಗರ್ ಮಾಡಲಾಗುವುದಿಲ್ಲ.

ಸಂಕೋಚನಗಳು

ಪ್ರಮೀತಿಯಸ್ TSDB ಅನ್ನು LSM (ಲಾಗ್ ಸ್ಟ್ರಕ್ಚರ್ಡ್ ಮರ್ಜ್) ಸ್ಟೋರ್‌ನಂತೆ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ: ಹೆಡ್ ಬ್ಲಾಕ್ ಅನ್ನು ನಿಯತಕಾಲಿಕವಾಗಿ ಡಿಸ್ಕ್‌ಗೆ ಫ್ಲಶ್ ಮಾಡಲಾಗುತ್ತದೆ, ಆದರೆ ಸಂಕುಚಿತ ಕಾರ್ಯವಿಧಾನವು ಪ್ರಶ್ನೆಗಳ ಸಮಯದಲ್ಲಿ ಹಲವಾರು ಬ್ಲಾಕ್‌ಗಳನ್ನು ಸ್ಕ್ಯಾನ್ ಮಾಡುವುದನ್ನು ತಪ್ಪಿಸಲು ಅನೇಕ ಬ್ಲಾಕ್‌ಗಳನ್ನು ಒಟ್ಟಿಗೆ ಸಂಯೋಜಿಸುತ್ತದೆ. ಒಂದು ದಿನದ ಲೋಡ್ ನಂತರ ಪರೀಕ್ಷಾ ವ್ಯವಸ್ಥೆಯಲ್ಲಿ ನಾನು ಗಮನಿಸಿದ ಬ್ಲಾಕ್‌ಗಳ ಸಂಖ್ಯೆಯನ್ನು ಇಲ್ಲಿ ನೀವು ನೋಡಬಹುದು.

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ನೀವು ಅಂಗಡಿಯ ಕುರಿತು ಇನ್ನಷ್ಟು ತಿಳಿದುಕೊಳ್ಳಲು ಬಯಸಿದರೆ, ನೀವು meta.json ಫೈಲ್ ಅನ್ನು ಪರಿಶೀಲಿಸಬಹುದು, ಇದು ಲಭ್ಯವಿರುವ ಬ್ಲಾಕ್‌ಗಳು ಮತ್ತು ಅವು ಹೇಗೆ ಬಂದವು ಎಂಬುದರ ಕುರಿತು ಮಾಹಿತಿಯನ್ನು ಹೊಂದಿದೆ.

{
       "ulid": "01CPZDPD1D9R019JS87TPV5MPE",
       "minTime": 1536472800000,
       "maxTime": 1536494400000,
       "stats": {
               "numSamples": 8292128378,
               "numSeries": 1673622,
               "numChunks": 69528220
       },
       "compaction": {
               "level": 2,
               "sources": [
                       "01CPYRY9MS465Y5ETM3SXFBV7X",
                       "01CPYZT0WRJ1JB1P0DP80VY5KJ",
                       "01CPZ6NR4Q3PDP3E57HEH760XS"
               ],
               "parents": [
                       {
                               "ulid": "01CPYRY9MS465Y5ETM3SXFBV7X",
                               "minTime": 1536472800000,
                               "maxTime": 1536480000000
                       },
                       {
                               "ulid": "01CPYZT0WRJ1JB1P0DP80VY5KJ",
                               "minTime": 1536480000000,
                               "maxTime": 1536487200000
                       },
                       {
                               "ulid": "01CPZ6NR4Q3PDP3E57HEH760XS",
                               "minTime": 1536487200000,
                               "maxTime": 1536494400000
                       }
               ]
       },
       "version": 1
}

ಪ್ರಮೀತಿಯಸ್‌ನಲ್ಲಿನ ಸಂಕೋಚನಗಳನ್ನು ಹೆಡ್ ಬ್ಲಾಕ್ ಅನ್ನು ಡಿಸ್ಕ್‌ಗೆ ಫ್ಲಶ್ ಮಾಡುವ ಸಮಯಕ್ಕೆ ಕಟ್ಟಲಾಗುತ್ತದೆ. ಈ ಹಂತದಲ್ಲಿ, ಅಂತಹ ಹಲವಾರು ಕಾರ್ಯಾಚರಣೆಗಳನ್ನು ಕೈಗೊಳ್ಳಬಹುದು.

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ಸಂಕೋಚನಗಳು ಯಾವುದೇ ರೀತಿಯಲ್ಲಿ ಸೀಮಿತವಾಗಿಲ್ಲ ಮತ್ತು ಎಕ್ಸಿಕ್ಯೂಶನ್ ಸಮಯದಲ್ಲಿ ದೊಡ್ಡ ಡಿಸ್ಕ್ I/O ಸ್ಪೈಕ್‌ಗಳನ್ನು ಉಂಟುಮಾಡಬಹುದು.

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

CPU ಲೋಡ್ ಸ್ಪೈಕ್‌ಗಳು

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ಸಹಜವಾಗಿ, ಇದು ಸಿಸ್ಟಮ್‌ನ ವೇಗದ ಮೇಲೆ ಋಣಾತ್ಮಕ ಪರಿಣಾಮವನ್ನು ಬೀರುತ್ತದೆ ಮತ್ತು LSM ಸಂಗ್ರಹಣೆಗೆ ಗಂಭೀರ ಸವಾಲನ್ನು ಒಡ್ಡುತ್ತದೆ: ಹೆಚ್ಚಿನ ಓವರ್‌ಹೆಡ್ ಅನ್ನು ಉಂಟುಮಾಡದೆ ಹೆಚ್ಚಿನ ವಿನಂತಿ ದರಗಳನ್ನು ಬೆಂಬಲಿಸಲು ಸಂಕೋಚನವನ್ನು ಹೇಗೆ ಮಾಡುವುದು?
ಸಂಕೋಚನ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ಮೆಮೊರಿಯ ಬಳಕೆಯು ಸಹ ಸಾಕಷ್ಟು ಆಸಕ್ತಿದಾಯಕವಾಗಿ ಕಾಣುತ್ತದೆ.

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ಸಂಕೋಚನದ ನಂತರ, ಹೆಚ್ಚಿನ ಮೆಮೊರಿಯು ಕ್ಯಾಶೆಡ್‌ನಿಂದ ಉಚಿತ ಸ್ಥಿತಿಯನ್ನು ಹೇಗೆ ಬದಲಾಯಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ನಾವು ನೋಡಬಹುದು: ಇದರರ್ಥ ಸಂಭಾವ್ಯ ಮೌಲ್ಯಯುತ ಮಾಹಿತಿಯನ್ನು ಅಲ್ಲಿಂದ ತೆಗೆದುಹಾಕಲಾಗಿದೆ. ಅದನ್ನು ಇಲ್ಲಿ ಬಳಸಿದರೆ ಕುತೂಹಲ fadvice() ಅಥವಾ ಇತರ ಕೆಲವು ಕಡಿಮೆಗೊಳಿಸುವಿಕೆ ತಂತ್ರ, ಅಥವಾ ಸಂಕೋಚನದ ಸಮಯದಲ್ಲಿ ನಾಶವಾದ ಬ್ಲಾಕ್‌ಗಳಿಂದ ಸಂಗ್ರಹವನ್ನು ಮುಕ್ತಗೊಳಿಸಲಾಗಿದೆಯೇ?

ವೈಫಲ್ಯದ ನಂತರ ಚೇತರಿಕೆ

ವೈಫಲ್ಯಗಳಿಂದ ಚೇತರಿಸಿಕೊಳ್ಳಲು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ, ಮತ್ತು ಒಳ್ಳೆಯ ಕಾರಣಕ್ಕಾಗಿ. ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ ಮಿಲಿಯನ್ ದಾಖಲೆಗಳ ಒಳಬರುವ ಸ್ಟ್ರೀಮ್‌ಗಾಗಿ, SSD ಡ್ರೈವ್ ಅನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಂಡು ಚೇತರಿಕೆ ನಡೆಸುವಾಗ ನಾನು ಸುಮಾರು 25 ನಿಮಿಷಗಳ ಕಾಲ ಕಾಯಬೇಕಾಯಿತು.

level=info ts=2018-09-13T13:38:14.09650965Z caller=main.go:222 msg="Starting Prometheus" version="(version=2.3.2, branch=v2.3.2, revision=71af5e29e815795e9dd14742ee7725682fa14b7b)"
level=info ts=2018-09-13T13:38:14.096599879Z caller=main.go:223 build_context="(go=go1.10.1, user=Jenkins, date=20180725-08:58:13OURCE)"
level=info ts=2018-09-13T13:38:14.096624109Z caller=main.go:224 host_details="(Linux 4.15.0-32-generic #35-Ubuntu SMP Fri Aug 10 17:58:07 UTC 2018 x86_64 1bee9e9b78cf (none))"
level=info ts=2018-09-13T13:38:14.096641396Z caller=main.go:225 fd_limits="(soft=1048576, hard=1048576)"
level=info ts=2018-09-13T13:38:14.097715256Z caller=web.go:415 component=web msg="Start listening for connections" address=:9090
level=info ts=2018-09-13T13:38:14.097400393Z caller=main.go:533 msg="Starting TSDB ..."
level=info ts=2018-09-13T13:38:14.098718401Z caller=repair.go:39 component=tsdb msg="found healthy block" mint=1536530400000 maxt=1536537600000 ulid=01CQ0FW3ME8Q5W2AN5F9CB7R0R
level=info ts=2018-09-13T13:38:14.100315658Z caller=web.go:467 component=web msg="router prefix" prefix=/prometheus
level=info ts=2018-09-13T13:38:14.101793727Z caller=repair.go:39 component=tsdb msg="found healthy block" mint=1536732000000 maxt=1536753600000 ulid=01CQ78486TNX5QZTBF049PQHSM
level=info ts=2018-09-13T13:38:14.102267346Z caller=repair.go:39 component=tsdb msg="found healthy block" mint=1536537600000 maxt=1536732000000 ulid=01CQ78DE7HSQK0C0F5AZ46YGF0
level=info ts=2018-09-13T13:38:14.102660295Z caller=repair.go:39 component=tsdb msg="found healthy block" mint=1536775200000 maxt=1536782400000 ulid=01CQ7SAT4RM21Y0PT5GNSS146Q
level=info ts=2018-09-13T13:38:14.103075885Z caller=repair.go:39 component=tsdb msg="found healthy block" mint=1536753600000 maxt=1536775200000 ulid=01CQ7SV8WJ3C2W5S3RTAHC2GHB
level=error ts=2018-09-13T14:05:18.208469169Z caller=wal.go:275 component=tsdb msg="WAL corruption detected; truncating" err="unexpected CRC32 checksum d0465484, want 0" file=/opt/prometheus/data/.prom2-data/wal/007357 pos=15504363
level=info ts=2018-09-13T14:05:19.471459777Z caller=main.go:543 msg="TSDB started"
level=info ts=2018-09-13T14:05:19.471604598Z caller=main.go:603 msg="Loading configuration file" filename=/etc/prometheus.yml
level=info ts=2018-09-13T14:05:19.499156711Z caller=main.go:629 msg="Completed loading of configuration file" filename=/etc/prometheus.yml
level=info ts=2018-09-13T14:05:19.499228186Z caller=main.go:502 msg="Server is ready to receive web requests."

ಚೇತರಿಕೆ ಪ್ರಕ್ರಿಯೆಯ ಮುಖ್ಯ ಸಮಸ್ಯೆ ಹೆಚ್ಚಿನ ಮೆಮೊರಿ ಬಳಕೆಯಾಗಿದೆ. ಸಾಮಾನ್ಯ ಪರಿಸ್ಥಿತಿಯಲ್ಲಿ ಸರ್ವರ್ ಅದೇ ಪ್ರಮಾಣದ ಮೆಮೊರಿಯೊಂದಿಗೆ ಸ್ಥಿರವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬ ಅಂಶದ ಹೊರತಾಗಿಯೂ, ಅದು ಕ್ರ್ಯಾಶ್ ಆಗಿದ್ದರೆ ಅದು OOM ನಿಂದ ಚೇತರಿಸಿಕೊಳ್ಳುವುದಿಲ್ಲ. ಡೇಟಾ ಸಂಗ್ರಹಣೆಯನ್ನು ನಿಷ್ಕ್ರಿಯಗೊಳಿಸುವುದು, ಸರ್ವರ್ ಅನ್ನು ತರುವುದು, ಅದನ್ನು ಚೇತರಿಸಿಕೊಳ್ಳಲು ಮತ್ತು ಸಂಗ್ರಹಣೆಯನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಿ ರೀಬೂಟ್ ಮಾಡಲು ನಾನು ಕಂಡುಕೊಂಡ ಏಕೈಕ ಪರಿಹಾರವಾಗಿದೆ.

ಬೆಚ್ಚಗಾಗುತ್ತಿದೆ

ಅಭ್ಯಾಸದ ಸಮಯದಲ್ಲಿ ನೆನಪಿನಲ್ಲಿಟ್ಟುಕೊಳ್ಳಬೇಕಾದ ಮತ್ತೊಂದು ನಡವಳಿಕೆಯು ಪ್ರಾರಂಭದ ನಂತರ ಕಡಿಮೆ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಹೆಚ್ಚಿನ ಸಂಪನ್ಮೂಲ ಬಳಕೆಯ ನಡುವಿನ ಸಂಬಂಧವಾಗಿದೆ. ಕೆಲವು ಸಮಯದಲ್ಲಿ, ಆದರೆ ಎಲ್ಲಾ ಪ್ರಾರಂಭಗಳಲ್ಲಿ, ನಾನು CPU ಮತ್ತು ಮೆಮೊರಿಯಲ್ಲಿ ಗಂಭೀರವಾದ ಲೋಡ್ ಅನ್ನು ಗಮನಿಸಿದೆ.

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ಮೆಮೊರಿ ಬಳಕೆಯಲ್ಲಿನ ಅಂತರವು ಪ್ರಮೀತಿಯಸ್ ಪ್ರಾರಂಭದಿಂದ ಎಲ್ಲಾ ಸಂಗ್ರಹಣೆಗಳನ್ನು ಕಾನ್ಫಿಗರ್ ಮಾಡಲು ಸಾಧ್ಯವಿಲ್ಲ ಎಂದು ಸೂಚಿಸುತ್ತದೆ ಮತ್ತು ಕೆಲವು ಮಾಹಿತಿಯು ಕಳೆದುಹೋಗಿದೆ.
ಹೆಚ್ಚಿನ CPU ಮತ್ತು ಮೆಮೊರಿ ಲೋಡ್‌ಗೆ ನಿಖರವಾದ ಕಾರಣಗಳನ್ನು ನಾನು ಕಂಡುಕೊಂಡಿಲ್ಲ. ಹೆಚ್ಚಿನ ಆವರ್ತನದೊಂದಿಗೆ ಹೆಡ್ ಬ್ಲಾಕ್‌ನಲ್ಲಿ ಹೊಸ ಸಮಯದ ಸರಣಿಯನ್ನು ರಚಿಸುವುದು ಇದಕ್ಕೆ ಕಾರಣ ಎಂದು ನಾನು ಅನುಮಾನಿಸುತ್ತೇನೆ.

CPU ಲೋಡ್ ಉಲ್ಬಣಗೊಳ್ಳುತ್ತದೆ

ಸಾಕಷ್ಟು ಹೆಚ್ಚಿನ I/O ಲೋಡ್ ಅನ್ನು ರಚಿಸುವ ಸಂಕೋಚನಗಳ ಜೊತೆಗೆ, ಪ್ರತಿ ಎರಡು ನಿಮಿಷಗಳಿಗೊಮ್ಮೆ CPU ಲೋಡ್‌ನಲ್ಲಿ ಗಂಭೀರ ಸ್ಪೈಕ್‌ಗಳನ್ನು ನಾನು ಗಮನಿಸಿದ್ದೇನೆ. ಇನ್‌ಪುಟ್ ಹರಿವು ಹೆಚ್ಚಿರುವಾಗ ಸ್ಫೋಟಗಳು ಹೆಚ್ಚು ಉದ್ದವಾಗಿರುತ್ತವೆ ಮತ್ತು ಗೋ ಕಸ ಸಂಗ್ರಾಹಕದಿಂದ ಉಂಟಾದಂತೆ ಕಂಡುಬರುತ್ತವೆ, ಕನಿಷ್ಠ ಕೆಲವು ಕೋರ್‌ಗಳನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಲೋಡ್ ಮಾಡಲಾಗುತ್ತದೆ.

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ಈ ಕುಣಿತಗಳು ಅಷ್ಟೊಂದು ಅತ್ಯಲ್ಪವಲ್ಲ. ಇವುಗಳು ಸಂಭವಿಸಿದಾಗ, ಪ್ರಮೀಥಿಯಸ್‌ನ ಆಂತರಿಕ ಪ್ರವೇಶ ಬಿಂದು ಮತ್ತು ಮೆಟ್ರಿಕ್‌ಗಳು ಲಭ್ಯವಾಗುವುದಿಲ್ಲ, ಇದೇ ಅವಧಿಯಲ್ಲಿ ಡೇಟಾ ಅಂತರವನ್ನು ಉಂಟುಮಾಡುತ್ತದೆ.

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ಪ್ರಮೀತಿಯಸ್ ರಫ್ತುದಾರರು ಒಂದು ಸೆಕೆಂಡಿಗೆ ಸ್ಥಗಿತಗೊಳ್ಳುವುದನ್ನು ಸಹ ನೀವು ಗಮನಿಸಬಹುದು.

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ಕಸ ಸಂಗ್ರಹಣೆಯೊಂದಿಗೆ (ಜಿಸಿ) ಪರಸ್ಪರ ಸಂಬಂಧವನ್ನು ನಾವು ಗಮನಿಸಬಹುದು.

ಪ್ರಮೀತಿಯಸ್ 2 ರಲ್ಲಿ TSDB ವಿಶ್ಲೇಷಣೆ

ತೀರ್ಮಾನಕ್ಕೆ

Prometheus 2 ರಲ್ಲಿ TSDB ವೇಗವಾಗಿದೆ, ಲಕ್ಷಾಂತರ ಸಮಯ ಸರಣಿಗಳನ್ನು ಮತ್ತು ಅದೇ ಸಮಯದಲ್ಲಿ ಸಾಕಷ್ಟು ಸಾಧಾರಣ ಯಂತ್ರಾಂಶವನ್ನು ಬಳಸಿಕೊಂಡು ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ ಸಾವಿರಾರು ದಾಖಲೆಗಳನ್ನು ನಿರ್ವಹಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿದೆ. CPU ಮತ್ತು ಡಿಸ್ಕ್ I/O ಬಳಕೆ ಕೂಡ ಆಕರ್ಷಕವಾಗಿದೆ. ನನ್ನ ಉದಾಹರಣೆಯು ಬಳಸಿದ ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ 200 ಮೆಟ್ರಿಕ್‌ಗಳನ್ನು ತೋರಿಸಿದೆ.

ವಿಸ್ತರಣೆಯನ್ನು ಯೋಜಿಸಲು, ನೀವು ಸಾಕಷ್ಟು ಪ್ರಮಾಣದ ಮೆಮೊರಿಯ ಬಗ್ಗೆ ನೆನಪಿಟ್ಟುಕೊಳ್ಳಬೇಕು ಮತ್ತು ಇದು ನಿಜವಾದ ಮೆಮೊರಿಯಾಗಿರಬೇಕು. ನಾನು ಗಮನಿಸಿದ ಮೆಮೊರಿಯ ಪ್ರಮಾಣವು ಒಳಬರುವ ಸ್ಟ್ರೀಮ್‌ನ ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ 5 ರೆಕಾರ್ಡ್‌ಗಳಿಗೆ ಸುಮಾರು 100 GB ಆಗಿತ್ತು, ಇದು ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್ ಸಂಗ್ರಹದೊಂದಿಗೆ ಸುಮಾರು 000 GB ಆಕ್ರಮಿತ ಮೆಮೊರಿಯನ್ನು ನೀಡಿತು.

ಸಹಜವಾಗಿ, CPU ಮತ್ತು ಡಿಸ್ಕ್ I/O ಸ್ಪೈಕ್‌ಗಳನ್ನು ಪಳಗಿಸಲು ಇನ್ನೂ ಸಾಕಷ್ಟು ಕೆಲಸಗಳಿವೆ, ಮತ್ತು TSDB Prometheus 2 ಅನ್ನು InnoDB, TokuDB, RocksDB, WiredTiger ಗೆ ಹೇಗೆ ಹೋಲಿಸಲಾಗಿದೆ ಎಂಬುದನ್ನು ಪರಿಗಣಿಸಿದರೆ ಆಶ್ಚರ್ಯವೇನಿಲ್ಲ, ಆದರೆ ಅವೆಲ್ಲವೂ ಒಂದೇ ರೀತಿಯದ್ದಾಗಿದೆ. ಅವರ ಜೀವನ ಚಕ್ರದ ಆರಂಭದಲ್ಲಿ ಸಮಸ್ಯೆಗಳು.

ಮೂಲ: www.habr.com

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ