"Ang paglaum usa ka dili maayo nga estratehiya." SRE intensive sa Moscow, Pebrero 3-5

Gipahibalo namo ang unang praktikal nga kurso sa SRE sa Russia: Slurm SRE.

Atol sa intensive mogugol kami og tulo ka adlaw sa pagtukod, pagguba, pag-ayo ug pagpalambo sa usa ka aggregator nga website alang sa pagbaligya sa mga tiket sa sine.

"Ang paglaum usa ka dili maayo nga estratehiya." SRE intensive sa Moscow, Pebrero 3-5

Gipili namo ang usa ka ticket aggregator tungod kay kini adunay daghang mga senaryo sa kapakyasan: usa ka pagdagsang sa mga bisita ug mga pag-atake sa DDoS, ang kapakyasan sa usa sa daghang mga kritikal nga microservices (awtorisasyon, mga reserbasyon, pagproseso sa pagbayad), ang pagkadili magamit sa usa sa daghang mga sinehan (data exchange mahitungod sa anaa nga mga lingkoranan ug mga reserbasyon), ug sa ubos sa listahan.

Atong mugnaon ang konsepto sa Pagkakasaligan alang sa atong aggregator site, nga atong pauswagon pa sa Engineering, pag-analisar sa disenyo gikan sa punto sa panglantaw sa SRE, pagpili sa mga sukdanan, pag-set up sa ilang pag-monitor, pagwagtang sa mga mitumaw nga insidente, pagpahigayon og pagbansay alang sa team work sa mga insidente. sa mga kondisyon nga duol sa kombati, pag-organisar og usa ka debriefing .

Ang programa gipadagan sa mga empleyado sa Booking.com ug Google.
Niining higayona wala nay layo nga partisipasyon: ang kurso gitukod sa personal nga interaksyon ug pagtinabangay.

Mga detalye ubos sa pagputol

Mga mamumulong

Ivan Kruglov
Principal Developer sa Booking.com (Netherlands)
Sukad sa pag-apil sa Booking.com kaniadtong 2013, nagtrabaho siya sa mga proyekto sa imprastraktura sama sa giapod-apod nga pagpadala ug pagproseso sa mensahe, BigData ug web-stack, pagpangita.
Sa pagkakaron nagtrabaho sa mga isyu sa pagtukod og internal nga panganod ug Service Mesh.

Ben Tyler
Principal Developer sa Booking.com (USA)
Nag-apil sa internal nga pagpalambo sa plataporma sa Booking.com.
Espesyalista sa service mesh/service discovery, batch job scheduling, incident response ug postmortem process.
Nagsulti ug nagtudlo sa Russian.

Evgeniy Varavva
Kinatibuk-ang Developer sa Google (San Francisco).
Kasinatian gikan sa high-load nga mga proyekto sa web hangtod sa panukiduki sa panan-awon sa kompyuter ug robotics.
Sukad sa 2011, nakigbahin siya sa paghimo ug operasyon sa mga gipang-apod-apod nga mga sistema sa Google, nga nag-apil sa tibuuk nga siklo sa kinabuhi sa proyekto: pagkonsepto, disenyo ug arkitektura, paglansad, pagpilo ug tanan nga mga intermediate nga yugto.

Eduard Medvedev
CTO sa Tungsten Labs (Germany)
Nagtrabaho isip inhenyero sa StackStorm, responsable sa pagpaandar sa ChatOps sa plataporma. Gipalambo ug gipatuman ang ChatOps alang sa automation sa data center. Speaker sa Russian ug internasyonal nga mga komperensya.

Ang programa

Ang programa aktibo nga gipalambo. Karon ingon niini, sa Pebrero mahimo’g molambo ug modako.

Hilisgutan #1: Panguna nga mga prinsipyo ug pamaagi sa SRE

  • Unsa ang kinahanglan aron mahimong usa ka SRE?
  • DevOps batok sa SRE
  • Ngano nga gipabilhan sa mga developer ang SRE ug nasubo kaayo kung wala sila sa proyekto
  • SLI, SLO ug SLA
  • Sayop nga badyet ug ang papel niini sa SRE

Hilisgutan #2: Disenyo sa gipang-apod-apod nga mga sistema

  • Ang arkitektura ug pag-andar sa aplikasyon
  • Dili Abstract nga Dako nga Disenyo sa Sistema
  • Operability / Disenyo alang sa kapakyasan
  • gRPC o REST
  • Pag-bersyon ug atras nga pagkaangay

Topic #3: Giunsa ang usa ka proyekto sa SRE gidawat

  • Labing maayo nga mga gawi gikan sa SRE
  • Checklist sa pagdawat sa proyekto
  • Pag-log, metrics, pagsubay
  • Pagdala sa CI/CD sa atong kaugalingong mga kamot

Hilisgutan Num. 4: Disenyo ug paglansad sa usa ka giapod-apod nga sistema

  • Reverse engineering - giunsa ang pagtrabaho sa sistema?
  • Nagkauyon mi sa SLI ug SLO
  • Pagpraktis sa pagplano sa kapasidad
  • Ang paglansad sa trapiko sa aplikasyon, ang among mga tiggamit nagsugod sa "paggamit" niini
  • Paglansad sa Prometheus, Grafana, Elastic

Topic #5: Pag-monitor, Pag-obserbar ug Pag-alerto

  • Pagmonitor vs. Pagkamakita
  • Pag-set up sa pagmonitor ug pag-alerto sa Prometheus
  • Praktikal nga pagmonitor sa SLI ug SLO
  • Sintomas vs. Mga hinungdan
  • Black-Box batok. Pag-monitor sa White-Box
  • Giapod-apod nga pag-monitor sa aplikasyon ug pagkaanaa sa server
  • 4 bulawan nga mga senyales (anomaly detection)

Hilisgutan Num. 6: Pagpraktis sa pagsulay nga kasaligan sa sistema

  • Pagtrabaho ubos sa pressure
  • Pagkapakyas-injection
  • Kagubot nga Unggoy

Topic #7: Pagpraktis sa pagtubag sa insidente

  • Algoritmo sa pagdumala sa stress
  • Interaksyon tali sa mga partisipante sa insidente
  • Postmortem
  • Pagpaambit sa kahibalo
  • Pag-umol sa kultura
  • Pag-monitor sa sayup
  • Pagpahigayon sa walay ikasaway nga debriefing

Hilisgutan #8: Mga Praktis sa Pagdumala sa Load

  • Pagbalanse sa load
  • Ang pagtugot sa sayup sa aplikasyon: pagsulay pag-usab, pag-timeout, pagkapakyas sa pag-injection, circuit breaker
  • DDoS (pagmugna og load) + Cascading Failures

Hilisgutan #9: Tubag sa Insidente

  • Debriefing
  • On-Call Practice
  • Nagkalainlain nga klase sa mga aksidente (pagsulay, pagbag-o sa pag-configure, pagkapakyas sa hardware)
  • Mga protocol sa pagdumala sa insidente

Topic #10: Diagnosis ug pagsulbad sa problema

  • Pag-log
  • Pag-debug
  • Pagpraktis sa pagtuki ug pag-debug sa among aplikasyon

Hilisgutan #11: Pagsulay sa kasaligan sa sistema

  • Pagsulay sa Stress
  • Pagsulay sa pag-configure
  • Pagsulay sa performance
  • Pagpagawas sa kanaryo

Hilisgutan Num. 12: Independiyenteng trabaho ug pagrepaso

Mga rekomendasyon ug mga kinahanglanon alang sa mga partisipante

Ang SRE usa ka paningkamot sa grupo. Kami kusganong nagrekomendar sa pagkuha sa kurso isip usa ka team. Mao nga nagtanyag kami daghang mga diskwento alang sa andam nga mga team.

Ang presyo sa kurso kay 60 ₽ kada tawo.
Kung ang usa ka kompanya nagpadala usa ka grupo sa 5+ ka tawo - 40 ₽.

Ang kurso gitukod sa Kubernetes. Aron makapasar, kinahanglan nimong mahibal-an ang mga Kubernetes sa sukaranan nga lebel. Kung dili ka magtrabaho uban niya, mahimo kang moagi sa Slurm Basic (online o intensive Nobyembre 18-20).
Dugang pa, kinahanglan ka nga hanas sa Linux ug mahibal-an ang Gitlab ug Prometheus.

Регистрация

Kung adunay ka usa ka komplikado nga ideya alang sa pag-apil, pananglitan, alang sa CEO, CTO ug usa ka grupo sa mga developer nga moabut sa kurso, ug aron sila moagi sa usa ka internship nga gikonsiderar ang bertikal nga pagdumala, pagsulat kanako sa usa ka personal nga mensahe.

Source: www.habr.com

Idugang sa usa ka comment