స్లర్మ్ SRE. Booking.com మరియు Google.com నుండి నిపుణులతో పూర్తి ప్రయోగం

మా బృందం ప్రయోగాలను ఇష్టపడుతుంది. ప్రతి స్లర్మ్ మునుపటి వాటి యొక్క స్థిరమైన పునరావృతం కాదు, కానీ అనుభవంపై ప్రతిబింబం మరియు మంచి నుండి మంచికి మారడం. కానీ తో స్లర్మ్ SRE మేము పూర్తిగా కొత్త ఆకృతిని వర్తింపజేయాలని నిర్ణయించుకున్నాము - పాల్గొనేవారికి "పోరాట"కు వీలైనంత దగ్గరగా షరతులు ఇవ్వడానికి.

ఇంటెన్సివ్ కోర్సులో మనం ఏమి చేశామో క్లుప్తంగా వివరిస్తే: “మేము నిర్మిస్తాము, విచ్ఛిన్నం చేస్తాము, మరమ్మత్తు చేస్తాము,
మేము చదువుకుంటున్నాము." కేవలం అభ్యాసం, నిజమైన పరిష్కారాలు, నిజమైన సమస్యలు - కేవలం సిద్ధాంతంలో SRE విలువ తక్కువ.

డిమిత్రి అనటోలివిచ్ యొక్క ఉదాహరణను అనుసరించి, బలమైన పోటీతత్వం ఎవరినీ నిద్రపోవడానికి లేదా ఐఫోన్‌లో "యాంగ్రీ బర్డ్స్" లాంచ్ చేయడానికి అనుమతించని విధంగా పాల్గొనేవారిని జట్లుగా విభజించారు.

నలుగురు మెంటార్ల ద్వారా సమస్యలు, అవాంతరాలు, బగ్‌లు మరియు టాస్క్‌లు పాల్గొనేవారికి అందించబడ్డాయి. ఇవాన్ క్రుగ్లోవ్, Booking.comలో ప్రిన్సిపల్ డెవలపర్ (నెదర్లాండ్స్). బెన్ టైలర్, Booking.com (USA)లో ప్రిన్సిపల్ డెవలపర్. ఎడ్వర్డ్ మెద్వెదేవ్, టంగ్స్టన్ ల్యాబ్స్ (జర్మనీ) వద్ద CTO. Evgeniy Varavva, Googleలో సాధారణ డెవలపర్ (శాన్ ఫ్రాన్సిస్కో).

అంతేకాకుండా, పాల్గొనేవారు జట్లుగా విభజించబడ్డారు మరియు ఒకరితో ఒకరు పోటీపడతారు. ఆసక్తికరమైన?

స్లర్మ్ SRE. Booking.com మరియు Google.com నుండి నిపుణులతో పూర్తి ప్రయోగం
ఇవాన్, బెన్, ఎడ్వర్డ్ మరియు ఎవ్జెనీలు పోటీ ప్రారంభానికి ముందు దయగల లెనినిస్ట్ స్క్వింట్‌లతో పేద స్లర్మ్ SRE పాల్గొనేవారిని చూస్తారు.

కాబట్టి పని:

మనం మనది, కొత్త ప్రపంచాన్ని నిర్మిస్తాం...

సినిమా టిక్కెట్ అగ్రిగేటర్ వెబ్‌సైట్ ఉంది. సంఘటనలు ముందుగా పనిచేసిన దృష్టాంతంలో మార్గదర్శకులచే కనుగొనబడ్డాయి (ప్రత్యేకంగా అధునాతనమైన మరియు కృత్రిమమైన మెరుగుదలలను ఎవరూ మినహాయించనప్పటికీ), సైట్ యొక్క పనితీరు వివిధ కొలమానాల ద్వారా వివరించబడింది. సమస్యలు చాలా భిన్నంగా ఉంటాయి: మౌలిన్ రూజ్ థియేటర్ టిక్కెట్లు డేటాబేస్లో లోడ్ చేయబడవు; చలనచిత్రాలు మరియు ప్రదర్శనల పోస్టర్లు 10 సెకన్ల కంటే ఎక్కువ డేటాబేస్లో లోడ్ చేయబడతాయి; వ్యక్తిగత చిత్రం యొక్క వివరణ ఘనీభవిస్తుంది; 0,1% ఆర్డర్‌లు ఇప్పటికే రిజర్వ్ చేయబడ్డాయి; కాలానుగుణంగా చెల్లింపు ప్రాసెసింగ్ సిస్టమ్ ఒకటి లేదా రెండు నిమిషాలు క్రాష్ అవుతుంది. మరియు అతని నిజమైన ఉద్యోగంలో స్లర్మ్ SRE పాల్గొనేవారికి సంభవించే అనేక, చాలా, చాలా అసహ్యకరమైన విషయాలు.

స్లర్మ్ SRE. Booking.com మరియు Google.com నుండి నిపుణులతో పూర్తి ప్రయోగం
మేము దేనినైనా నిర్వహించడానికి సిద్ధంగా ఉన్నాము మరియు ప్రతి ఒక్కరినీ.

మా దీర్ఘకాల వెబ్‌సైట్ అనేక మైక్రోసర్వీస్‌లను కలిగి ఉంది. అన్ని సినిమాల నుండి షోలు, ధరలు మరియు అందుబాటులో ఉన్న సీట్లకు సంబంధించిన డేటాను సమగ్రపరచడం దీని పని; ఇది సినిమా ప్రకటనలను చూపుతుంది, సినిమా, షో, హాల్ మరియు స్థలాన్ని ఎంచుకోవడానికి, బుక్ చేసుకోవడానికి మరియు టిక్కెట్ల కోసం చెల్లించడానికి మిమ్మల్ని అనుమతిస్తుంది. సాధారణంగా, వీక్షకుడు మాత్రమే కలలు కనే ప్రతిదీ. కానీ లోపల సైట్ యొక్క స్థిరత్వం మరియు ప్రాప్యత కోసం టైటానిక్ పోరాటం ఏమి జరుగుతుందో వినియోగదారు అనుమానించరు.

ఇంటెన్సివ్ సైట్ కోసం, మేము SLO, SLI, SLA సూచికలను రూపొందించాము, ఆర్కిటెక్చర్ మరియు ఇన్‌ఫ్రాస్ట్రక్చర్‌ను అభివృద్ధి చేసాము, సైట్‌ని అమలు చేసాము, పర్యవేక్షణ మరియు హెచ్చరికను సెటప్ చేసాము. మరియు మేము దూరంగా వెళ్తాము.

SLO, SLI, SLA

SLI - సేవా స్థాయి సూచికలు. SLOలు సేవా స్థాయి లక్ష్యాలు. SLA - సేవా స్థాయి ఒప్పందాలు.

SLA అనేది ITIL మెథడాలజీ పదం, ఇది సేవ యొక్క కస్టమర్ మరియు దాని సరఫరాదారు మధ్య అధికారిక ఒప్పందాన్ని సూచిస్తుంది, ఇందులో సేవ యొక్క వివరణ, పార్టీల హక్కులు మరియు బాధ్యతలు మరియు, ముఖ్యంగా, దీనిని అందించడానికి అంగీకరించిన నాణ్యత స్థాయి. సేవ.

SLO అనేది సేవా స్థాయి లక్ష్యం: SLI ద్వారా కొలవబడే సేవా స్థాయి కోసం లక్ష్య విలువ లేదా విలువల పరిధి. SLOకి సాధారణ విలువ “SLI ≤ లక్ష్యం” లేదా “తక్కువ పరిమితి ≤ SLI ≤ ఎగువ పరిమితి”.

SLI అనేది సేవా స్థాయి సూచిక-అందించిన సేవ స్థాయి యొక్క ఒక అంశం యొక్క జాగ్రత్తగా నిర్వచించబడిన పరిమాణాత్మక కొలత. చాలా సేవల కోసం, కీ SLI అభ్యర్థన జాప్యంగా పరిగణించబడుతుంది - అభ్యర్థనకు ప్రతిస్పందనను తిరిగి ఇవ్వడానికి ఎంత సమయం పడుతుంది. ఇతర సాధారణ SLIలు ఎర్రర్ రేట్‌ను కలిగి ఉంటాయి, తరచుగా స్వీకరించబడిన అన్ని అభ్యర్థనలలో ఒక భాగం వలె వ్యక్తీకరించబడతాయి మరియు సిస్టమ్ నిర్గమాంశ, సాధారణంగా సెకనుకు అభ్యర్థనలలో కొలుస్తారు.

అన్నింటిలో మొదటిది, మేము విమానాలను విచ్ఛిన్నం చేస్తాము, ఆపై అమ్మాయిలు, ఆపై అమ్మాయిలు...

అంతర్గత మరియు బాహ్య కారకాలు మొదటి నిమిషాల నుండి SLO ను "పాడుచేయడం" ప్రారంభించాయి. డెవలపర్ తప్పులు, మౌలిక సదుపాయాల వైఫల్యాలు, సందర్శకుల ప్రవాహం మరియు DDoS దాడులు వంటి ప్రతిదీ నిర్వాహకుల తలపై పడింది. SLO మరింత దిగజారుతున్న ప్రతిదీ.

స్లర్మ్ SRE. Booking.com మరియు Google.com నుండి నిపుణులతో పూర్తి ప్రయోగం
"- డియర్ పార్టిసిపెంట్స్, నేను మిమ్మల్ని సంతోషపెట్టడానికి తొందరపడ్డాను, మీరు విఫలమయ్యే మొదటి విషయం... అంతా!"

అలాగే, వక్తలు స్థిరత్వం, ఎర్రర్ బడ్జెట్, టెస్టింగ్ ప్రాక్టీస్, అంతరాయాల నిర్వహణ మరియు కార్యాచరణ లోడ్ గురించి చర్చించారు.

మేము స్టోకర్స్ కాదు, వడ్రంగి కాదు ...

అప్పుడు పాల్గొనేవారు విషయాలను పరిష్కరించడం ప్రారంభించారు - ప్రధాన విషయం ఏమిటంటే మొదట ఏమి పట్టుకోవాలో అర్థం చేసుకోవడం.

స్లర్మ్ SRE. Booking.com మరియు Google.com నుండి నిపుణులతో పూర్తి ప్రయోగం
"- ప్రభూ, ఇది ఇలా, ఈ రూపంలో మరియు అటువంటి స్థితిలో నేను ఎప్పుడూ చూడలేదు!"

కాబట్టి, ఒక ప్రమాదం జరిగింది. చెల్లింపు ప్రాసెసింగ్ సేవ డౌన్‌లో ఉంది. సాధ్యమైనంత తక్కువ సమయంలో కార్యాచరణను పునరుద్ధరించడానికి ఎలా పని చేయాలి?

స్లర్మ్ SRE. Booking.com మరియు Google.com నుండి నిపుణులతో పూర్తి ప్రయోగం
నిపుణులు, పాల్గొనేవారిని ఆప్యాయంగా చూస్తూ, మరో ట్రిక్ సిద్ధం చేస్తున్నారు.

ప్రతి బృందం ప్రమాదాన్ని తొలగించడానికి సమూహం యొక్క పనిని నిర్వహిస్తుంది - సహోద్యోగులను కలిగి ఉంటుంది, ఆసక్తిగల పార్టీలకు (వాటాదారులకు) తెలియజేస్తుంది. అదే సమయంలో, ప్రాధాన్యతలు సెట్ చేయబడ్డాయి. ఈ విధంగా, పాల్గొనేవారు చాలా పరిమిత సమయ పరిస్థితుల్లో ఒత్తిడిలో పనిచేయడానికి శిక్షణ పొందారు.

స్లర్మ్ SRE. Booking.com మరియు Google.com నుండి నిపుణులతో పూర్తి ప్రయోగం
"ఏ విధమైన భయానక సంఘటన బయటకు వచ్చింది?!"

శ్వాస వదులుతూ... వ్యాయామం పూర్తి చేయండి

స్పీకర్‌లతో కలిసి, ప్రతి సమస్య పరిష్కరించబడిన తర్వాత మరియు సైట్ తాత్కాలికంగా స్థిరీకరించబడిన తర్వాత, బృందం సంఘటనలను SRE కోణం నుండి అధ్యయనం చేసింది. మేము సమస్యలను వివరంగా విశ్లేషించాము - సంభవించే కారణాలు, తొలగింపు పురోగతి. ఆ తర్వాత, టీమ్‌లవారీగా మరియు సమిష్టిగా, మేము వాటిని ఎలా మరింత నిరోధించాలనే దానిపై నిర్ణయాలు తీసుకున్నాము: పర్యవేక్షణను ఎలా మెరుగుపరచాలి, నిర్మాణాన్ని తెలివిగా ఎలా మార్చాలి, అభివృద్ధి మరియు ఆపరేషన్ విధానాన్ని ఎలా సర్దుబాటు చేయాలి, నిబంధనలను ఎలా సరిచేయాలి. వక్తలు పోస్టుమార్టం నిర్వహించే విధానాన్ని ప్రదర్శించారు.

స్లర్మ్ SRE. Booking.com మరియు Google.com నుండి నిపుణులతో పూర్తి ప్రయోగం
“ఇంకా ఎవరికి హింస కావాలి! - నేను!"

జట్ల విజయాలు ఎలక్ట్రానిక్ స్కోర్‌బోర్డ్‌లో ఖచ్చితంగా మరియు స్పష్టంగా నమోదు చేయబడ్డాయి.

స్లర్మ్ SRE. Booking.com మరియు Google.com నుండి నిపుణులతో పూర్తి ప్రయోగం

మొదటి స్థానాలకు - వాటాదారుల నుండి బోనస్.

స్లర్మ్ SRE. Booking.com మరియు Google.com నుండి నిపుణులతో పూర్తి ప్రయోగం

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి