ProHoster > Блог > Pagdumala > "Ang paglaum usa ka dili maayo nga estratehiya." SRE intensive sa Moscow, Pebrero 3-5
"Ang paglaum usa ka dili maayo nga estratehiya." SRE intensive sa Moscow, Pebrero 3-5
Gipahibalo namo ang unang praktikal nga kurso sa SRE sa Russia: Slurm SRE.
Atol sa intensive mogugol kami og tulo ka adlaw sa pagtukod, pagguba, pag-ayo ug pagpalambo sa usa ka aggregator nga website alang sa pagbaligya sa mga tiket sa sine.
Gipili namo ang usa ka ticket aggregator tungod kay kini adunay daghang mga senaryo sa kapakyasan: usa ka pagdagsang sa mga bisita ug mga pag-atake sa DDoS, ang kapakyasan sa usa sa daghang mga kritikal nga microservices (awtorisasyon, mga reserbasyon, pagproseso sa pagbayad), ang pagkadili magamit sa usa sa daghang mga sinehan (data exchange mahitungod sa anaa nga mga lingkoranan ug mga reserbasyon), ug sa ubos sa listahan.
Atong mugnaon ang konsepto sa Pagkakasaligan alang sa atong aggregator site, nga atong pauswagon pa sa Engineering, pag-analisar sa disenyo gikan sa punto sa panglantaw sa SRE, pagpili sa mga sukdanan, pag-set up sa ilang pag-monitor, pagwagtang sa mga mitumaw nga insidente, pagpahigayon og pagbansay alang sa team work sa mga insidente. sa mga kondisyon nga duol sa kombati, pag-organisar og usa ka debriefing .
Ang programa gipadagan sa mga empleyado sa Booking.com ug Google.
Niining higayona wala nay layo nga partisipasyon: ang kurso gitukod sa personal nga interaksyon ug pagtinabangay.
Mga detalye ubos sa pagputol
Mga mamumulong
Ivan Kruglov
Principal Developer sa Booking.com (Netherlands)
Sukad sa pag-apil sa Booking.com kaniadtong 2013, nagtrabaho siya sa mga proyekto sa imprastraktura sama sa giapod-apod nga pagpadala ug pagproseso sa mensahe, BigData ug web-stack, pagpangita.
Sa pagkakaron nagtrabaho sa mga isyu sa pagtukod og internal nga panganod ug Service Mesh.
Ben Tyler
Principal Developer sa Booking.com (USA)
Nag-apil sa internal nga pagpalambo sa plataporma sa Booking.com.
Espesyalista sa service mesh/service discovery, batch job scheduling, incident response ug postmortem process.
Nagsulti ug nagtudlo sa Russian.
Evgeniy Varavva
Kinatibuk-ang Developer sa Google (San Francisco).
Kasinatian gikan sa high-load nga mga proyekto sa web hangtod sa panukiduki sa panan-awon sa kompyuter ug robotics.
Sukad sa 2011, nakigbahin siya sa paghimo ug operasyon sa mga gipang-apod-apod nga mga sistema sa Google, nga nag-apil sa tibuuk nga siklo sa kinabuhi sa proyekto: pagkonsepto, disenyo ug arkitektura, paglansad, pagpilo ug tanan nga mga intermediate nga yugto.
Eduard Medvedev
CTO sa Tungsten Labs (Germany)
Nagtrabaho isip inhenyero sa StackStorm, responsable sa pagpaandar sa ChatOps sa plataporma. Gipalambo ug gipatuman ang ChatOps alang sa automation sa data center. Speaker sa Russian ug internasyonal nga mga komperensya.
Ang programa
Ang programa aktibo nga gipalambo. Karon ingon niini, sa Pebrero mahimo’g molambo ug modako.
Hilisgutan #1: Panguna nga mga prinsipyo ug pamaagi sa SRE
Unsa ang kinahanglan aron mahimong usa ka SRE?
DevOps batok sa SRE
Ngano nga gipabilhan sa mga developer ang SRE ug nasubo kaayo kung wala sila sa proyekto
SLI, SLO ug SLA
Sayop nga badyet ug ang papel niini sa SRE
Hilisgutan #2: Disenyo sa gipang-apod-apod nga mga sistema
Ang arkitektura ug pag-andar sa aplikasyon
Dili Abstract nga Dako nga Disenyo sa Sistema
Operability / Disenyo alang sa kapakyasan
gRPC o REST
Pag-bersyon ug atras nga pagkaangay
Topic #3: Giunsa ang usa ka proyekto sa SRE gidawat
Labing maayo nga mga gawi gikan sa SRE
Checklist sa pagdawat sa proyekto
Pag-log, metrics, pagsubay
Pagdala sa CI/CD sa atong kaugalingong mga kamot
Hilisgutan Num. 4: Disenyo ug paglansad sa usa ka giapod-apod nga sistema
Reverse engineering - giunsa ang pagtrabaho sa sistema?
Nagkauyon mi sa SLI ug SLO
Pagpraktis sa pagplano sa kapasidad
Ang paglansad sa trapiko sa aplikasyon, ang among mga tiggamit nagsugod sa "paggamit" niini
Paglansad sa Prometheus, Grafana, Elastic
Topic #5: Pag-monitor, Pag-obserbar ug Pag-alerto
Pagmonitor vs. Pagkamakita
Pag-set up sa pagmonitor ug pag-alerto sa Prometheus
Praktikal nga pagmonitor sa SLI ug SLO
Sintomas vs. Mga hinungdan
Black-Box batok. Pag-monitor sa White-Box
Giapod-apod nga pag-monitor sa aplikasyon ug pagkaanaa sa server
4 bulawan nga mga senyales (anomaly detection)
Hilisgutan Num. 6: Pagpraktis sa pagsulay nga kasaligan sa sistema
Pagtrabaho ubos sa pressure
Pagkapakyas-injection
Kagubot nga Unggoy
Topic #7: Pagpraktis sa pagtubag sa insidente
Algoritmo sa pagdumala sa stress
Interaksyon tali sa mga partisipante sa insidente
Postmortem
Pagpaambit sa kahibalo
Pag-umol sa kultura
Pag-monitor sa sayup
Pagpahigayon sa walay ikasaway nga debriefing
Hilisgutan #8: Mga Praktis sa Pagdumala sa Load
Pagbalanse sa load
Ang pagtugot sa sayup sa aplikasyon: pagsulay pag-usab, pag-timeout, pagkapakyas sa pag-injection, circuit breaker
DDoS (pagmugna og load) + Cascading Failures
Hilisgutan #9: Tubag sa Insidente
Debriefing
On-Call Practice
Nagkalainlain nga klase sa mga aksidente (pagsulay, pagbag-o sa pag-configure, pagkapakyas sa hardware)
Mga protocol sa pagdumala sa insidente
Topic #10: Diagnosis ug pagsulbad sa problema
Pag-log
Pag-debug
Pagpraktis sa pagtuki ug pag-debug sa among aplikasyon
Hilisgutan #11: Pagsulay sa kasaligan sa sistema
Pagsulay sa Stress
Pagsulay sa pag-configure
Pagsulay sa performance
Pagpagawas sa kanaryo
Hilisgutan Num. 12: Independiyenteng trabaho ug pagrepaso
Mga rekomendasyon ug mga kinahanglanon alang sa mga partisipante
Ang SRE usa ka paningkamot sa grupo. Kami kusganong nagrekomendar sa pagkuha sa kurso isip usa ka team. Mao nga nagtanyag kami daghang mga diskwento alang sa andam nga mga team.
Ang presyo sa kurso kay 60 ₽ kada tawo.
Kung ang usa ka kompanya nagpadala usa ka grupo sa 5+ ka tawo - 40 ₽.
Ang kurso gitukod sa Kubernetes. Aron makapasar, kinahanglan nimong mahibal-an ang mga Kubernetes sa sukaranan nga lebel. Kung dili ka magtrabaho uban niya, mahimo kang moagi sa Slurm Basic (online o intensive Nobyembre 18-20).
Dugang pa, kinahanglan ka nga hanas sa Linux ug mahibal-an ang Gitlab ug Prometheus.
Kung adunay ka usa ka komplikado nga ideya alang sa pag-apil, pananglitan, alang sa CEO, CTO ug usa ka grupo sa mga developer nga moabut sa kurso, ug aron sila moagi sa usa ka internship nga gikonsiderar ang bertikal nga pagdumala, pagsulat kanako sa usa ka personal nga mensahe.