"ఆశ ఒక చెడ్డ వ్యూహం." మాస్కోలో SRE ఇంటెన్సివ్, ఫిబ్రవరి 3-5

మేము రష్యాలో SRE పై మొదటి ప్రాక్టికల్ కోర్సును ప్రకటిస్తున్నాము: స్లర్మ్ SRE.

ఇంటెన్సివ్ సమయంలో మేము సినిమా టిక్కెట్లను విక్రయించడానికి అగ్రిగేటర్ వెబ్‌సైట్‌ను నిర్మించడం, విచ్ఛిన్నం చేయడం, మరమ్మతులు చేయడం మరియు మెరుగుపరచడం కోసం మూడు రోజులు గడుపుతాము.

"ఆశ ఒక చెడ్డ వ్యూహం." మాస్కోలో SRE ఇంటెన్సివ్, ఫిబ్రవరి 3-5

మేము టిక్కెట్ అగ్రిగేటర్‌ని ఎంచుకున్నాము ఎందుకంటే దీనికి అనేక వైఫల్య దృశ్యాలు ఉన్నాయి: సందర్శకుల ప్రవాహం మరియు DDoS దాడులు, అనేక క్లిష్టమైన మైక్రోసర్వీస్‌లలో ఒకదాని వైఫల్యం (అధికారీకరణ, రిజర్వేషన్‌లు, చెల్లింపు ప్రాసెసింగ్), అనేక సినిమాల్లో ఒకటి అందుబాటులో లేకపోవడం (డేటా మార్పిడి గురించి అందుబాటులో ఉన్న సీట్లు మరియు రిజర్వేషన్లు), మరియు జాబితాలో మరింత దిగువన.

మేము మా అగ్రిగేటర్ సైట్ కోసం విశ్వసనీయత భావనను రూపొందిస్తాము, దీనిని మేము ఇంజినీరింగ్‌లో మరింత అభివృద్ధి చేస్తాము, SRE కోణం నుండి డిజైన్‌ను విశ్లేషిస్తాము, కొలమానాలను ఎంచుకుంటాము, వాటి పర్యవేక్షణను సెటప్ చేస్తాము, ఉద్భవిస్తున్న సంఘటనలను తొలగిస్తాము, సంఘటనలతో జట్టు పని కోసం శిక్షణ నిర్వహిస్తాము. పోరాటానికి దగ్గరగా ఉన్న పరిస్థితుల్లో, చర్చను నిర్వహించండి.

ఈ కార్యక్రమం Booking.com మరియు Google ఉద్యోగులచే నిర్వహించబడుతుంది.
ఈసారి రిమోట్ భాగస్వామ్యం ఉండదు: వ్యక్తిగత పరస్పర చర్య మరియు జట్టుకృషిపై కోర్సు నిర్మించబడింది.

కట్ కింద వివరాలు

స్పీకర్లు

ఇవాన్ క్రుగ్లోవ్
Booking.com (నెదర్లాండ్స్)లో ప్రధాన డెవలపర్
2013లో Booking.comలో చేరినప్పటి నుండి, అతను పంపిణీ చేయబడిన సందేశ డెలివరీ మరియు ప్రాసెసింగ్, BigData మరియు వెబ్-స్టాక్, శోధన వంటి అవస్థాపన ప్రాజెక్ట్‌లలో పనిచేశాడు.
ప్రస్తుతం అంతర్గత క్లౌడ్ మరియు సర్వీస్ మెష్‌ని నిర్మించే సమస్యలపై పని చేస్తోంది.

బెన్ టైలర్
Booking.com (USA)లో ప్రధాన డెవలపర్
Booking.com ప్లాట్‌ఫారమ్ యొక్క అంతర్గత అభివృద్ధిలో నిమగ్నమై ఉంది.
సర్వీస్ మెష్ / సర్వీస్ డిస్కవరీ, బ్యాచ్ జాబ్ షెడ్యూలింగ్, ఇన్సిడెంట్ రెస్పాన్స్ మరియు పోస్ట్‌మార్టం ప్రాసెస్‌లో ప్రత్యేకత.
రష్యన్ భాషలో మాట్లాడుతుంది మరియు బోధిస్తుంది.

ఎవ్జెనీ వరవ్వ
గూగుల్‌లో జనరల్ డెవలపర్ (శాన్ ఫ్రాన్సిస్కో).
అధిక-లోడ్ వెబ్ ప్రాజెక్ట్‌ల నుండి కంప్యూటర్ విజన్ మరియు రోబోటిక్స్‌లో పరిశోధన వరకు అనుభవం.
2011 నుండి, అతను Googleలో పంపిణీ చేయబడిన సిస్టమ్‌ల సృష్టి మరియు ఆపరేషన్‌లో పాల్గొన్నాడు, ప్రాజెక్ట్ యొక్క పూర్తి జీవిత చక్రంలో పాల్గొంటాడు: సంభావితీకరణ, రూపకల్పన మరియు నిర్మాణం, ప్రయోగ, మడత మరియు అన్ని మధ్యంతర దశలు.

ఎడ్వర్డ్ మెద్వెదేవ్
టంగ్‌స్టన్ ల్యాబ్స్ (జర్మనీ)లో CTO
ప్లాట్‌ఫారమ్ యొక్క ChatOps కార్యాచరణకు బాధ్యత వహించే StackStormలో ఇంజనీర్‌గా పనిచేశారు. డేటా సెంటర్ ఆటోమేషన్ కోసం చాట్‌ఆప్‌లను అభివృద్ధి చేసి అమలు చేసింది. రష్యన్ మరియు అంతర్జాతీయ సమావేశాలలో స్పీకర్.

కార్యక్రమం

కార్యక్రమం చురుకుగా అభివృద్ధి చేయబడుతోంది. ఇప్పుడు ఇలా కనిపిస్తోంది, ఫిబ్రవరి నాటికి ఇది మెరుగుపడవచ్చు మరియు విస్తరించవచ్చు.

అంశం #1: SRE యొక్క ప్రాథమిక సూత్రాలు మరియు పద్ధతులు

  • SRE కావడానికి ఏమి పడుతుంది?
  • DevOps vs SRE
  • డెవలపర్‌లు SREకి ఎందుకు విలువ ఇస్తారు మరియు వారు ప్రాజెక్ట్‌లో లేనప్పుడు చాలా విచారంగా ఉన్నారు
  • SLI, SLO మరియు SLA
  • ఎర్రర్ బడ్జెట్ మరియు SREలో దాని పాత్ర

అంశం #2: పంపిణీ వ్యవస్థల రూపకల్పన

  • అప్లికేషన్ ఆర్కిటెక్చర్ మరియు కార్యాచరణ
  • నాన్-అబ్‌స్ట్రాక్ట్ లార్జ్ సిస్టమ్ డిజైన్
  • వైఫల్యం కోసం ఆపరేబిలిటీ / డిజైన్
  • gRPC లేదా REST
  • సంస్కరణ మరియు వెనుకబడిన అనుకూలత

అంశం #3: SRE ప్రాజెక్ట్ ఎలా ఆమోదించబడుతుంది

  • SRE నుండి ఉత్తమ అభ్యాసాలు
  • ప్రాజెక్ట్ అంగీకార చెక్‌లిస్ట్
  • లాగింగ్, మెట్రిక్స్, ట్రేసింగ్
  • CI/CDని మన చేతుల్లోకి తీసుకోవడం

అంశం నం. 4: పంపిణీ వ్యవస్థ రూపకల్పన మరియు ప్రారంభం

  • రివర్స్ ఇంజనీరింగ్ - సిస్టమ్ ఎలా పని చేస్తుంది?
  • మేము SLI మరియు SLOపై అంగీకరిస్తున్నాము
  • సామర్థ్య ప్రణాళికను ప్రాక్టీస్ చేయండి
  • అనువర్తనానికి ట్రాఫిక్‌ను ప్రారంభించడం, మా వినియోగదారులు దానిని "ఉపయోగించడం" ప్రారంభిస్తారు
  • ప్రోమేతియస్, గ్రాఫానా, ఎలాస్టిక్ లాంచ్ అవుతోంది

అంశం #5: పర్యవేక్షణ, పరిశీలన మరియు హెచ్చరిక

  • పర్యవేక్షణ vs. గమనించదగినది
  • ప్రోమేతియస్‌తో పర్యవేక్షణ మరియు హెచ్చరికను ఏర్పాటు చేస్తోంది
  • SLI మరియు SLO యొక్క ఆచరణాత్మక పర్యవేక్షణ
  • లక్షణాలు vs. కారణాలు
  • బ్లాక్-బాక్స్ vs. వైట్-బాక్స్ మానిటరింగ్
  • అప్లికేషన్ మరియు సర్వర్ లభ్యత యొక్క పంపిణీ పర్యవేక్షణ
  • 4 గోల్డెన్ సిగ్నల్స్ (అనామలీ డిటెక్షన్)

అంశం నం. 6: సిస్టమ్ విశ్వసనీయతను పరీక్షించే అభ్యాసం

  • ఒత్తిడిలో పని చేస్తున్నారు
  • వైఫల్యం-ఇంజెక్షన్
  • ఖోస్ మంకీ

అంశం #7: సంఘటన ప్రతిస్పందన అభ్యాసం

  • ఒత్తిడి నిర్వహణ అల్గోరిథం
  • సంఘటనలో పాల్గొనేవారి మధ్య పరస్పర చర్య
  • పోస్టుమార్టం
  • జ్ఞాన భాగస్వామ్యం
  • సంస్కృతిని తీర్చిదిద్దడం
  • తప్పు పర్యవేక్షణ
  • దోషరహిత చర్చను నిర్వహించడం

అంశం #8: లోడ్ నిర్వహణ పద్ధతులు

  • లోడ్ బ్యాలెన్సింగ్
  • అప్లికేషన్ ఫాల్ట్ టాలరెన్స్: మళ్లీ ప్రయత్నించండి, గడువు ముగిసింది, వైఫల్యం ఇంజెక్షన్, సర్క్యూట్ బ్రేకర్
  • DDoS (లోడ్‌ను సృష్టిస్తోంది) + క్యాస్కేడింగ్ వైఫల్యాలు

అంశం #9: సంఘటన ప్రతిస్పందన

  • debriefing
  • ఆన్-కాల్ ప్రాక్టీస్
  • వివిధ రకాల ప్రమాదాలు (పరీక్ష, కాన్ఫిగరేషన్ మార్పులు, హార్డ్‌వేర్ వైఫల్యం)
  • సంఘటన నిర్వహణ ప్రోటోకాల్‌లు

అంశం #10: రోగ నిర్ధారణ మరియు సమస్య పరిష్కారం

  • లాగింగ్
  • డీబగ్గింగ్
  • మా అప్లికేషన్‌లో విశ్లేషణ మరియు డీబగ్గింగ్‌ను ప్రాక్టీస్ చేయండి

అంశం #11: సిస్టమ్ విశ్వసనీయత పరీక్ష

  • ఒత్తిడి పరీక్ష
  • కాన్ఫిగరేషన్ పరీక్ష
  • పనితీరు పరీక్ష
  • కానరీ విడుదల

అంశం సంఖ్య 12: స్వతంత్ర పని మరియు సమీక్ష

పాల్గొనేవారికి సిఫార్సులు మరియు అవసరాలు

SRE ఒక జట్టు ప్రయత్నం. మేము ఒక జట్టుగా కోర్సు తీసుకోవాలని గట్టిగా సిఫార్సు చేస్తున్నాము. అందుకే మేము రెడీమేడ్ జట్లకు పెద్ద డిస్కౌంట్లను అందిస్తాము.

కోర్సు యొక్క ధర వ్యక్తికి 60 ₽.
ఒక కంపెనీ 5+ వ్యక్తుల సమూహాన్ని పంపితే - 40 ₽.

కోర్సు కుబెర్నెట్స్‌లో నిర్మించబడింది. ఉత్తీర్ణత సాధించడానికి, మీరు ప్రాథమిక స్థాయిలో కుబెర్నెట్‌లను తెలుసుకోవాలి. మీరు అతనితో పని చేయకపోతే, మీరు స్లర్మ్ బేసిక్ (онлайн లేదా ఇంటెన్సివ్ నవంబర్ 18-20).
అదనంగా, మీరు Linuxలో ప్రావీణ్యం కలిగి ఉండాలి మరియు Gitlab మరియు Prometheus గురించి తెలుసుకోవాలి.

నమోదు

మీరు పాల్గొనడం కోసం సంక్లిష్టమైన ఆలోచనను కలిగి ఉంటే, ఉదాహరణకు, CEO, CTO మరియు డెవలపర్‌ల బృందం కోర్సుకు రావాలని మరియు వారు నిర్వహణ నిలువుగా పరిగణనలోకి తీసుకొని ఇంటర్న్‌షిప్‌ను పొందాలని, నాకు వ్యక్తిగత సందేశంలో వ్రాయండి.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి