ನಮ್ಮ ತಂಡವು ಪ್ರಯೋಗಗಳನ್ನು ಪ್ರೀತಿಸುತ್ತದೆ. ಪ್ರತಿಯೊಂದು ಸ್ಲರ್ಮ್ ಹಿಂದಿನವುಗಳ ಸ್ಥಿರ ಪುನರಾವರ್ತನೆಯಲ್ಲ, ಆದರೆ ಅನುಭವದ ಪ್ರತಿಬಿಂಬ ಮತ್ತು ಉತ್ತಮದಿಂದ ಉತ್ತಮವಾದ ಪರಿವರ್ತನೆಯಾಗಿದೆ. ಆದರೆ ಜೊತೆ
ತೀವ್ರವಾದ ಕೋರ್ಸ್ನಲ್ಲಿ ನಾವು ಏನು ಮಾಡಿದ್ದೇವೆ ಎಂಬುದನ್ನು ನಾವು ಸಂಕ್ಷಿಪ್ತವಾಗಿ ವಿವರಿಸಿದರೆ: “ನಾವು ನಿರ್ಮಿಸುತ್ತೇವೆ, ಒಡೆಯುತ್ತೇವೆ, ದುರಸ್ತಿ ಮಾಡುತ್ತೇವೆ,
ನಾವು ಅಧ್ಯಯನ ಮಾಡುತ್ತಿದ್ದೇವೆ." ಕೇವಲ ಅಭ್ಯಾಸ, ನೈಜ ಪರಿಹಾರಗಳು, ನೈಜ ಸಮಸ್ಯೆಗಳು - ಕೇವಲ ಸಿದ್ಧಾಂತದಲ್ಲಿ SRE ಕಡಿಮೆ ಮೌಲ್ಯಯುತವಾಗಿದೆ.
ಡಿಮಿಟ್ರಿ ಅನಾಟೊಲಿವಿಚ್ ಅವರ ಉದಾಹರಣೆಯನ್ನು ಅನುಸರಿಸಿ ಯಾರಾದರೂ ನಿದ್ರಿಸಲು ಅಥವಾ ಐಫೋನ್ನಲ್ಲಿ "ಆಂಗ್ರಿ ಬರ್ಡ್ಸ್" ಅನ್ನು ಪ್ರಾರಂಭಿಸಲು ಯಾವುದೇ ಉತ್ಸಾಹಭರಿತ ಸ್ಪರ್ಧಾತ್ಮಕ ಮನೋಭಾವವನ್ನು ಅನುಮತಿಸದಂತೆ ಭಾಗವಹಿಸುವವರನ್ನು ತಂಡಗಳಾಗಿ ವಿಂಗಡಿಸಲಾಗಿದೆ.
ನಾಲ್ಕು ಮಾರ್ಗದರ್ಶಕರಿಂದ ಭಾಗವಹಿಸುವವರಿಗೆ ಸಮಸ್ಯೆಗಳು, ತೊಂದರೆಗಳು, ದೋಷಗಳು ಮತ್ತು ಕಾರ್ಯಗಳನ್ನು ಒದಗಿಸಲಾಗಿದೆ. ಇವಾನ್ ಕ್ರುಗ್ಲೋವ್, Booking.com ನಲ್ಲಿ ಪ್ರಧಾನ ಡೆವಲಪರ್ (ನೆದರ್ಲ್ಯಾಂಡ್ಸ್). ಬೆನ್ ಟೈಲರ್, Booking.com (USA) ನಲ್ಲಿ ಪ್ರಧಾನ ಡೆವಲಪರ್ ಎಡ್ವರ್ಡ್ ಮೆಡ್ವೆಡೆವ್, ಟಂಗ್ಸ್ಟನ್ ಲ್ಯಾಬ್ಸ್ (ಜರ್ಮನಿ) ನಲ್ಲಿ CTO. Evgeniy Varavva, Google ನಲ್ಲಿ ಸಾಮಾನ್ಯ ಡೆವಲಪರ್ (ಸ್ಯಾನ್ ಫ್ರಾನ್ಸಿಸ್ಕೋ).
ಇದಲ್ಲದೆ, ಭಾಗವಹಿಸುವವರನ್ನು ತಂಡಗಳಾಗಿ ವಿಂಗಡಿಸಲಾಗಿದೆ ಮತ್ತು ಪರಸ್ಪರ ಸ್ಪರ್ಧಿಸುತ್ತಾರೆ. ಆಸಕ್ತಿದಾಯಕ?
ಇವಾನ್, ಬೆನ್, ಎಡ್ವರ್ಡ್ ಮತ್ತು ಎವ್ಗೆನಿ ಅವರು ಕಳಪೆ ಸ್ಲರ್ಮ್ SRE ಭಾಗವಹಿಸುವವರನ್ನು ಸ್ಪರ್ಧೆಯ ಪ್ರಾರಂಭದ ಮೊದಲು ರೀತಿಯ ಲೆನಿನಿಸ್ಟ್ ಸ್ಕ್ವಿಂಟ್ಗಳೊಂದಿಗೆ ನೋಡುತ್ತಾರೆ.
ನಾವು ನಮ್ಮವರು, ನಾವು ಹೊಸ ಪ್ರಪಂಚವನ್ನು ನಿರ್ಮಿಸುತ್ತೇವೆ ...
ಚಲನಚಿತ್ರ ಟಿಕೆಟ್ ಅಗ್ರಿಗೇಟರ್ ವೆಬ್ಸೈಟ್ ಇದೆ. ಘಟನೆಗಳನ್ನು ಪೂರ್ವ-ಕೆಲಸದ ಸನ್ನಿವೇಶದಲ್ಲಿ ಮಾರ್ಗದರ್ಶಕರು ಕಂಡುಹಿಡಿದಿದ್ದಾರೆ (ಯಾರೂ ನಿರ್ದಿಷ್ಟವಾಗಿ ಅತ್ಯಾಧುನಿಕ ಮತ್ತು ಕಪಟ ಸುಧಾರಣೆಯನ್ನು ಹೊರತುಪಡಿಸುವುದಿಲ್ಲ), ಸೈಟ್ನ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ವಿವಿಧ ಮೆಟ್ರಿಕ್ಗಳಿಂದ ವಿವರಿಸಲಾಗಿದೆ. ಸಮಸ್ಯೆಗಳು ತುಂಬಾ ವಿಭಿನ್ನವಾಗಿರಬಹುದು: ಮೌಲಿನ್ ರೂಜ್ ಥಿಯೇಟರ್ಗೆ ಟಿಕೆಟ್ಗಳನ್ನು ಡೇಟಾಬೇಸ್ಗೆ ಲೋಡ್ ಮಾಡಲಾಗುವುದಿಲ್ಲ; ಚಲನಚಿತ್ರಗಳು ಮತ್ತು ಪ್ರದರ್ಶನಗಳ ಪೋಸ್ಟರ್ಗಳನ್ನು 10 ಸೆಕೆಂಡುಗಳಿಗಿಂತ ಹೆಚ್ಚು ಡೇಟಾಬೇಸ್ಗೆ ಲೋಡ್ ಮಾಡಲಾಗುತ್ತದೆ; ಪ್ರತ್ಯೇಕ ಚಿತ್ರದ ವಿವರಣೆ ಹೆಪ್ಪುಗಟ್ಟುತ್ತದೆ; 0,1% ಆದೇಶಗಳನ್ನು ಈಗಾಗಲೇ ಕಾಯ್ದಿರಿಸಲಾಗಿದೆ; ಕಾಲಕಾಲಕ್ಕೆ ಪಾವತಿ ಪ್ರಕ್ರಿಯೆ ವ್ಯವಸ್ಥೆಯು ಒಂದು ನಿಮಿಷ ಅಥವಾ ಎರಡು ನಿಮಿಷಗಳ ಕಾಲ ಕ್ರ್ಯಾಶ್ ಆಗುತ್ತದೆ. ಮತ್ತು ಸ್ಲರ್ಮ್ ಎಸ್ಆರ್ಇ ಪಾಲ್ಗೊಳ್ಳುವವರಿಗೆ ಅವರ ನೈಜ ಕೆಲಸದಲ್ಲಿ ಸಂಭವಿಸಬಹುದಾದ ಅನೇಕ, ಹಲವು, ಹಲವು ಅಹಿತಕರ ಸಂಗತಿಗಳು.
ನಾವು ಏನು ಬೇಕಾದರೂ ನಿಭಾಯಿಸಲು ಸಿದ್ಧರಿದ್ದೇವೆ ... ಮತ್ತು ಎಲ್ಲರೂ.
ನಮ್ಮ ದೀರ್ಘಕಾಲದಿಂದ ಬಳಲುತ್ತಿರುವ ವೆಬ್ಸೈಟ್ ಹಲವಾರು ಸೂಕ್ಷ್ಮ ಸೇವೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಎಲ್ಲಾ ಚಿತ್ರಮಂದಿರಗಳಿಂದ ಪ್ರದರ್ಶನಗಳು, ಬೆಲೆಗಳು ಮತ್ತು ಲಭ್ಯವಿರುವ ಆಸನಗಳ ಡೇಟಾವನ್ನು ಒಟ್ಟುಗೂಡಿಸುವುದು ಇದರ ಕಾರ್ಯವಾಗಿದೆ; ಇದು ಚಲನಚಿತ್ರ ಪ್ರಕಟಣೆಗಳನ್ನು ತೋರಿಸುತ್ತದೆ, ಸಿನಿಮಾ, ಪ್ರದರ್ಶನ, ಹಾಲ್ ಮತ್ತು ಸ್ಥಳವನ್ನು ಆಯ್ಕೆ ಮಾಡಲು, ಬುಕ್ ಮಾಡಲು ಮತ್ತು ಟಿಕೆಟ್ಗಳಿಗೆ ಪಾವತಿಸಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ. ಸಾಮಾನ್ಯವಾಗಿ, ವೀಕ್ಷಕರು ಮಾತ್ರ ಕನಸು ಕಾಣುವ ಎಲ್ಲವೂ. ಆದರೆ ಸೈಟ್ನ ಸ್ಥಿರತೆ ಮತ್ತು ಪ್ರವೇಶಕ್ಕಾಗಿ ಟೈಟಾನಿಕ್ ಹೋರಾಟವು ಒಳಗೆ ನಡೆಯುತ್ತಿದೆ ಎಂದು ಬಳಕೆದಾರರು ಅನುಮಾನಿಸುವುದಿಲ್ಲ.
ತೀವ್ರವಾದ ಸೈಟ್ಗಾಗಿ, ನಾವು SLO, SLI, SLA ಸೂಚಕಗಳನ್ನು ರಚಿಸಿದ್ದೇವೆ, ವಾಸ್ತುಶಿಲ್ಪ ಮತ್ತು ಮೂಲಸೌಕರ್ಯವನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದೇವೆ, ಸೈಟ್ ಅನ್ನು ನಿಯೋಜಿಸಿದ್ದೇವೆ, ಮೇಲ್ವಿಚಾರಣೆ ಮತ್ತು ಎಚ್ಚರಿಕೆಯನ್ನು ಹೊಂದಿಸಿದ್ದೇವೆ. ಮತ್ತು ನಾವು ದೂರ ಹೋಗುತ್ತೇವೆ.
SLO, SLI, SLA
SLI - ಸೇವಾ ಮಟ್ಟದ ಸೂಚಕಗಳು. SLOಗಳು ಸೇವಾ ಮಟ್ಟದ ಗುರಿಗಳಾಗಿವೆ. SLA - ಸೇವಾ ಮಟ್ಟದ ಒಪ್ಪಂದಗಳು.
SLA ಎನ್ನುವುದು ITIL ಮೆಥಡಾಲಜಿ ಪದವಾಗಿದ್ದು, ಸೇವೆಯ ಗ್ರಾಹಕ ಮತ್ತು ಅದರ ಪೂರೈಕೆದಾರರ ನಡುವಿನ ಔಪಚಾರಿಕ ಒಪ್ಪಂದವನ್ನು ಸೂಚಿಸುತ್ತದೆ, ಇದು ಸೇವೆಯ ವಿವರಣೆಯನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ, ಪಕ್ಷಗಳ ಹಕ್ಕುಗಳು ಮತ್ತು ಕಟ್ಟುಪಾಡುಗಳು ಮತ್ತು, ಮುಖ್ಯವಾಗಿ, ಇದನ್ನು ಒದಗಿಸುವುದಕ್ಕಾಗಿ ಗುಣಮಟ್ಟವನ್ನು ಒಪ್ಪಿಕೊಂಡಿದೆ. ಸೇವೆ.
SLO ಒಂದು ಸೇವಾ ಮಟ್ಟದ ಉದ್ದೇಶವಾಗಿದೆ: SLI ಯಿಂದ ಅಳೆಯುವ ಸೇವಾ ಮಟ್ಟಕ್ಕೆ ಗುರಿ ಮೌಲ್ಯ ಅಥವಾ ಮೌಲ್ಯಗಳ ಶ್ರೇಣಿ. SLO ಗಾಗಿ ಸಾಮಾನ್ಯ ಮೌಲ್ಯವೆಂದರೆ "SLI ≤ ಗುರಿ" ಅಥವಾ "ಕಡಿಮೆ ಮಿತಿ ≤ SLI ≤ ಮೇಲಿನ ಮಿತಿ".
SLI ಎನ್ನುವುದು ಸೇವಾ ಮಟ್ಟದ ಸೂಚಕವಾಗಿದೆ-ಒದಗಿಸಿದ ಸೇವೆಯ ಮಟ್ಟದ ಒಂದು ಅಂಶದ ಎಚ್ಚರಿಕೆಯಿಂದ ವ್ಯಾಖ್ಯಾನಿಸಲಾದ ಪರಿಮಾಣಾತ್ಮಕ ಅಳತೆಯಾಗಿದೆ. ಹೆಚ್ಚಿನ ಸೇವೆಗಳಿಗೆ, ಕೀ SLI ಅನ್ನು ವಿನಂತಿಯ ಸುಪ್ತತೆ ಎಂದು ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ - ವಿನಂತಿಗೆ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು ಹಿಂತಿರುಗಿಸಲು ಎಷ್ಟು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ. ಇತರ ಸಾಮಾನ್ಯ SLIಗಳು ದೋಷ ದರವನ್ನು ಒಳಗೊಂಡಿರುತ್ತವೆ, ಸಾಮಾನ್ಯವಾಗಿ ಸ್ವೀಕರಿಸಿದ ಎಲ್ಲಾ ವಿನಂತಿಗಳ ಒಂದು ಭಾಗವಾಗಿ ವ್ಯಕ್ತಪಡಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ಸಿಸ್ಟಮ್ ಥ್ರೋಪುಟ್ ಅನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಪ್ರತಿ ಸೆಕೆಂಡಿಗೆ ವಿನಂತಿಗಳಲ್ಲಿ ಅಳೆಯಲಾಗುತ್ತದೆ.
ಮೊದಲನೆಯದಾಗಿ, ನಾವು ವಿಮಾನಗಳನ್ನು ಒಡೆಯುತ್ತೇವೆ, ಮತ್ತು ನಂತರ ಹುಡುಗಿಯರು, ಮತ್ತು ನಂತರ ಹುಡುಗಿಯರು ...
ಆಂತರಿಕ ಮತ್ತು ಬಾಹ್ಯ ಅಂಶಗಳು ಮೊದಲ ನಿಮಿಷಗಳಿಂದ SLO ಅನ್ನು "ಹಾಳು" ಮಾಡಲು ಪ್ರಾರಂಭಿಸಿದವು. ಎಲ್ಲವೂ ನಿರ್ವಾಹಕರ ತಲೆಯ ಮೇಲೆ ಬಿದ್ದವು-ಡೆವಲಪರ್ ತಪ್ಪುಗಳು, ಮೂಲಸೌಕರ್ಯ ವೈಫಲ್ಯಗಳು, ಸಂದರ್ಶಕರ ಒಳಹರಿವು ಮತ್ತು DDoS ದಾಳಿಗಳು. SLO ಅನ್ನು ಹದಗೆಡಿಸುವ ಎಲ್ಲವೂ.
"- ಆತ್ಮೀಯ ಭಾಗವಹಿಸುವವರೇ, ನಾನು ನಿಮ್ಮನ್ನು ಮೆಚ್ಚಿಸಲು ಆತುರಪಡುತ್ತೇನೆ, ನೀವು ವಿಫಲಗೊಳ್ಳುವ ಮೊದಲ ವಿಷಯ ... ಎಲ್ಲವೂ!"
ದಾರಿಯುದ್ದಕ್ಕೂ, ಸ್ಪೀಕರ್ಗಳು ಸ್ಥಿರತೆ, ದೋಷ ಬಜೆಟ್, ಪರೀಕ್ಷಾ ಅಭ್ಯಾಸ, ಅಡಚಣೆಗಳ ನಿರ್ವಹಣೆ ಮತ್ತು ಕಾರ್ಯಾಚರಣೆಯ ಹೊರೆ ಕುರಿತು ಚರ್ಚಿಸಿದರು.
ನಾವು ಸ್ಟೋಕರ್ಗಳಲ್ಲ, ಬಡಗಿಗಳಲ್ಲ...
ನಂತರ ಭಾಗವಹಿಸುವವರು ವಿಷಯಗಳನ್ನು ಸರಿಪಡಿಸಲು ಪ್ರಾರಂಭಿಸಿದರು - ಮೊದಲು ಏನನ್ನು ಪಡೆದುಕೊಳ್ಳಬೇಕೆಂದು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ಮುಖ್ಯ ವಿಷಯ.
"- ಕರ್ತನೇ, ಈ ರೂಪದಲ್ಲಿ ಮತ್ತು ಅಂತಹ ಸ್ಥಾನದಲ್ಲಿ ಅದು ಮುರಿಯುವುದನ್ನು ನಾನು ನೋಡಿಲ್ಲ!"
ಹಾಗಾಗಿ ಅಪಘಾತ ಸಂಭವಿಸಿದೆ. ಪಾವತಿ ಪ್ರಕ್ರಿಯೆ ಸೇವೆಯು ಸ್ಥಗಿತಗೊಂಡಿದೆ. ಕಡಿಮೆ ಸಮಯದಲ್ಲಿ ಕಾರ್ಯವನ್ನು ಪುನಃಸ್ಥಾಪಿಸಲು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸಬೇಕು?
ತಜ್ಞರು, ಭಾಗವಹಿಸುವವರನ್ನು ಪ್ರೀತಿಯಿಂದ ನೋಡುತ್ತಾ, ಮತ್ತೊಂದು ತಂತ್ರವನ್ನು ಸಿದ್ಧಪಡಿಸುತ್ತಿದ್ದಾರೆ.
ಪ್ರತಿ ತಂಡವು ಅಪಘಾತವನ್ನು ತೊಡೆದುಹಾಕಲು ಗುಂಪಿನ ಕೆಲಸವನ್ನು ಆಯೋಜಿಸುತ್ತದೆ - ಸಹೋದ್ಯೋಗಿಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ, ಆಸಕ್ತ ಪಕ್ಷಗಳಿಗೆ (ಮಧ್ಯಸ್ಥರು) ತಿಳಿಸುತ್ತದೆ. ಅದೇ ಸಮಯದಲ್ಲಿ, ಆದ್ಯತೆಗಳನ್ನು ಹೊಂದಿಸಲಾಗಿದೆ. ಈ ರೀತಿಯಾಗಿ, ಭಾಗವಹಿಸುವವರು ಅತ್ಯಂತ ಸೀಮಿತ ಸಮಯದ ಪರಿಸ್ಥಿತಿಗಳಲ್ಲಿ ಒತ್ತಡದಲ್ಲಿ ಕೆಲಸ ಮಾಡಲು ತರಬೇತಿ ನೀಡಿದರು.
"ಯಾವ ರೀತಿಯ ಭಯಾನಕ ಹೊರಬಂದಿದೆ?!"
ಉಸಿರನ್ನು ಬಿಡಿ... ಮತ್ತು ವ್ಯಾಯಾಮವನ್ನು ಮುಗಿಸಿ
ಸ್ಪೀಕರ್ಗಳೊಂದಿಗೆ, ಪ್ರತಿ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಿದ ನಂತರ ಮತ್ತು ಸೈಟ್ ಅನ್ನು ತಾತ್ಕಾಲಿಕವಾಗಿ ಸ್ಥಿರಗೊಳಿಸಿದ ನಂತರ, ತಂಡವು SRE ದೃಷ್ಟಿಕೋನದಿಂದ ಘಟನೆಗಳನ್ನು ಅಧ್ಯಯನ ಮಾಡಿದೆ. ನಾವು ಸಮಸ್ಯೆಗಳನ್ನು ವಿವರವಾಗಿ ವಿಶ್ಲೇಷಿಸಿದ್ದೇವೆ - ಸಂಭವಿಸುವ ಕಾರಣಗಳು, ನಿವಾರಣೆಯ ಪ್ರಗತಿ. ಅದರ ನಂತರ, ತಂಡ-ತಂಡ ಮತ್ತು ಸಾಮೂಹಿಕವಾಗಿ, ಅವುಗಳನ್ನು ಹೇಗೆ ತಡೆಯುವುದು ಎಂಬುದರ ಕುರಿತು ನಾವು ನಿರ್ಧಾರಗಳನ್ನು ಮಾಡಿದ್ದೇವೆ: ಮೇಲ್ವಿಚಾರಣೆಯನ್ನು ಹೇಗೆ ಸುಧಾರಿಸುವುದು, ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಬುದ್ಧಿವಂತಿಕೆಯಿಂದ ಬದಲಾಯಿಸುವುದು ಹೇಗೆ, ಅಭಿವೃದ್ಧಿ ಮತ್ತು ಕಾರ್ಯಾಚರಣೆಯ ವಿಧಾನವನ್ನು ಹೇಗೆ ಹೊಂದಿಸುವುದು, ನಿಯಮಗಳನ್ನು ಹೇಗೆ ಸರಿಪಡಿಸುವುದು. ಭಾಷಣಕಾರರು ಮರಣೋತ್ತರ ಪರೀಕ್ಷೆ ನಡೆಸುವ ಅಭ್ಯಾಸವನ್ನು ಪ್ರದರ್ಶಿಸಿದರು.
“ಯಾರಿಗೆ ಹಿಂಸೆ ಬೇಕು! - ನಾನು!"
ತಂಡಗಳ ಯಶಸ್ಸನ್ನು ಎಲೆಕ್ಟ್ರಾನಿಕ್ ಸ್ಕೋರ್ಬೋರ್ಡ್ನಲ್ಲಿ ಕಟ್ಟುನಿಟ್ಟಾಗಿ ಮತ್ತು ಸ್ಪಷ್ಟವಾಗಿ ದಾಖಲಿಸಲಾಗಿದೆ.
ಮೊದಲ ಸ್ಥಾನಗಳಿಗೆ - ಮಧ್ಯಸ್ಥಗಾರರಿಂದ ಬೋನಸ್.
ಮೂಲ: www.habr.com