"Harepan mangrupikeun strategi anu goréng." SRE intensif di Moscow, 3-5 Pebruari

Kami ngumumkeun kursus praktis munggaran ngeunaan SRE di Rusia: Slurm SRE.

Salila intensif urang bakal méakkeun tilu poé ngawangun, megatkeun, repairing sarta ngaronjatkeun hiji ramatloka agrégator pikeun ngajual tiket pilem.

"Harepan mangrupikeun strategi anu goréng." SRE intensif di Moscow, 3-5 Pebruari

Kami milih agrégator tikét sabab gaduh seueur skenario kagagalan: panyaluran sémah sareng serangan DDoS, kagagalan salah sahiji seueur microservices kritis (otorisasi, reservations, pamrosésan pamayaran), henteu sayogi salah sahiji seueur bioskop (tukeran data ngeunaan korsi sadia tur reservations), sarta salajengna handap daptar.

Urang bakal ngarumuskeun konsép Reliability pikeun situs agrégator urang, nu urang salajengna bakal ngamekarkeun dina Téknik, nganalisis desain ti sudut pandang SRE, pilih metrics, nyetél monitoring maranéhanana, ngaleungitkeun kajadian munculna, ngalaksanakeun latihan pikeun gawé tim kalawan insiden. dina kaayaan deukeut ngempur, ngatur debriefing a.

Program ieu dijalankeun ku karyawan Booking.com sareng Google.
Waktos ieu moal aya partisipasi jarak jauh: kursus diwangun dina interaksi pribadi sareng kerja tim.

Rinci handapeun cut

Panyatur

Ivan Kruglov
Pangembang Utama di Booking.com (Walanda)
Kusabab ngagabung ka Booking.com di 2013, anjeunna parantos damel dina proyék infrastruktur sapertos pangiriman pesen anu disebarkeun sareng pamrosésan, BigData sareng tumpukan wéb, milarian.
Ayeuna damel dina masalah ngawangun awan internal sareng Service Mesh.

Ben Tyler
Pangembang Utama di Booking.com (USA)
Kalibet dina ngembangkeun internal tina platform Booking.com.
Spésialisasi dina jasa bolong / panemuan jasa, jadwal padamelan angkatan, réspon kajadian sareng prosés postmortem.
Nyarios sareng ngajar dina basa Rusia.

Evgeniy Varavva
Pamekar Umum di Google (San Fransisco).
Pangalaman tina proyék wéb beban tinggi pikeun panalungtikan dina visi komputer sareng robotika.
Kusabab 2011, anjeunna geus kalibet dina kreasi sarta operasi sistem disebarkeun di Google, ilubiung dina siklus hirup pinuh proyek: conceptualization, desain jeung arsitéktur, peluncuran, tilepan jeung sagala tahapan panengah.

Eduard Medvedev
CTO di Tungsten Labs (Jerman)
Gawéna salaku insinyur di StackStorm, jawab pungsionalitas ChatOps tina platform. Dimekarkeun sarta dilaksanakeun ChatOps pikeun automation puseur data. Speaker dina konferensi Rusia jeung internasional.

program

Program éta aktip dikembangkeun. Ayeuna sigana sapertos kieu, ku bulan Pebruari tiasa ningkatkeun sareng ngalegaan.

Topik #1: Prinsip dasar sareng metode SRE

  • Naon anu diperyogikeun pikeun janten SRE?
  • DevOps vs SRE
  • Naha pamekar ngahargaan SRE sareng hanjelu pisan nalika aranjeunna henteu aya dina proyék éta
  • SLI, SLO jeung SLA
  • Anggaran kasalahan sareng peranna dina SRE

Topik #2: Desain sistem disebarkeun

  • Arsitéktur aplikasi sareng fungsionalitas
  • Desain Sistim ageung non-abstrak
  • Operability / Desain pikeun kagagalan
  • gRPC atanapi REST
  • Vérsi sareng kasaluyuan mundur

Topik #3: Kumaha hiji proyék SRE ditarima

  • prakték pangalusna ti SRE
  • Daptar pariksa ditampa proyék
  • Logging, metrics, tracing
  • Nyandak CI / CD kana leungeun urang sorangan

Topik No.. 4: Desain sarta peluncuran sistem disebarkeun

  • Rékayasa sabalikna - kumaha sistemna jalanna?
  • Kami satuju kana SLI sareng SLO
  • Praktek perencanaan kapasitas
  • Ngaluncurkeun lalu lintas kana aplikasi, pangguna urang mimiti "nganggo" éta
  • Ngaluncurkeun Prometheus, Grafana, Elastis

Topik #5: Pangimeutan, Observability sareng Waspada

  • Ngawaskeun vs. Observability
  • Nyetel ngawaskeun sareng ngageter sareng Prometheus
  • Pengawasan praktis SLI sareng SLO
  • Gejala vs. Nyababkeun
  • Hideung-Kotak vs. Bodas-Box pangimeutan
  • Ngawaskeun disebarkeun aplikasi tur kasadiaan server
  • 4 sinyal emas (deteksi anomali)

Topik No.. 6: Prakték réliabilitas sistem tés

  • Gawé dina tekenan
  • Gagal-suntik
  • Rusuh Monyét

Topik #7: prakték respon Kajadian

  • Algoritma manajemén stress
  • Interaksi antara pamilon kajadian
  • Postmortem
  • Ngabagi pangaweruh
  • Ngawangun budaya
  • Ngawas kasalahan
  • Ngalaksanakeun debriefing tanpa cacad

Topik # 8: Prakték Manajemén Beban

  • Balancing beban
  • Kasabaran kasalahan aplikasi: cobian deui, seep, suntik gagal, pemutus sirkuit
  • DDoS (nyieun beban) + Cascading Failures

Topik #9: Tanggapan Kajadian

  • Duka
  • Praktek On-Call
  • Rupa-rupa kacilakaan (pangujian, parobahan konfigurasi, gagalna hardware)
  • Protokol manajemén kajadian

Topik #10: Diagnosis sareng ngarengsekeun masalah

  • logging
  • Debugging
  • Prakték analisis sareng debugging dina aplikasi urang

Topik #11: Tés réliabilitas sistem

  • Uji Stress
  • Uji konfigurasi
  • Nguji kinerja
  • Ngaleupaskeun Kanaria

Topik No.. 12: Karya bebas sarta review

Rekomendasi jeung sarat pikeun pamilon

SRE mangrupikeun usaha tim. Kami nyarankeun pisan nyandak kursus salaku tim. Éta pisan sababna naha urang nawiskeun diskon badag pikeun tim siap-dijieun.

Harga kursus nyaéta 60 ₽ per jalma.
Upami perusahaan ngirim sakelompok 5+ jalma - 40 ₽.

Kursus ieu diwangun dina Kubernetes. Pikeun lulus, anjeun kedah terang Kubernetes dina tingkat dasar. Upami anjeun henteu damel sareng anjeunna, anjeun tiasa ngalangkungan Slurm Basic (онлайн atawa intensif Nopémber 18-20).
Salaku tambahan, anjeun kedah pinter dina Linux sareng terang Gitlab sareng Prometheus.

daptaran

Upami Anjeun gaduh gagasan kompléks pikeun partisipasi, contona, pikeun CEO, CTO sarta tim pamekar datang ka kursus, sarta pikeun maranéhanana ngajalanan magang nyokot kana akun manajemén nangtung, nulis ka kuring dina pesen pribadi.

sumber: www.habr.com

Tambahkeun komentar