"Umid - bu yomon strategiya." Moskvada SRE intensiv, 3-5 fevral

Biz Rossiyada SRE bo'yicha birinchi amaliy kursni e'lon qilamiz: Slurm SRE.

Intensiv davrda biz kino chiptalarini sotish uchun agregator veb-saytini qurish, buzish, ta'mirlash va yaxshilash uchun uch kun sarflaymiz.

"Umid - bu yomon strategiya." Moskvada SRE intensiv, 3-5 fevral

Biz chipta agregatorini tanladik, chunki unda ko'plab muvaffaqiyatsizlik stsenariylari mavjud: tashrif buyuruvchilar oqimi va DDoS hujumlari, ko'plab muhim mikroservislardan birining ishlamay qolishi (avtorizatsiya, bron qilish, to'lovni qayta ishlash), ko'plab kinoteatrlardan birining mavjud emasligi (ma'lumotlar almashinuvi). mavjud o'rindiqlar va bandlovlar bo'yicha) va ro'yxatning pastki qismida.

Biz agregator saytimiz uchun Ishonchlilik kontseptsiyasini shakllantiramiz, uni muhandislik sohasida yanada rivojlantiramiz, dizaynni SRE nuqtai nazaridan tahlil qilamiz, o'lchovlarni tanlaymiz, ularning monitoringini o'rnatamiz, yuzaga keladigan hodisalarni bartaraf qilamiz, intsidentlar bilan jamoaviy ishlash bo'yicha treninglar o'tkazamiz. jangga yaqin sharoitlarda brifing tashkil qiling.

Dastur Booking.com va Google xodimlari tomonidan boshqariladi.
Bu safar masofaviy qatnashish bo'lmaydi: kurs shaxsiy o'zaro ta'sir va jamoaviy ish asosida qurilgan.

Kesish ostidagi tafsilotlar

Spikerlar

Ivan Kruglov
Booking.com kompaniyasining asosiy dasturchisi (Niderlandiya)
2013-yilda Booking.com’ga qo‘shilganidan beri u tarqatilgan xabarlarni yetkazib berish va qayta ishlash, BigData va veb-stek, qidiruv kabi infratuzilma loyihalarida ishlagan.
Hozirda ichki bulut va Service Mesh yaratish masalalari ustida ishlamoqda.

Ben Tayler
Booking.com kompaniyasining asosiy dasturchisi (AQSh)
Booking.com platformasining ichki rivojlanishi bilan shug'ullanadi.
Xizmat ko'rsatish tarmog'i/xizmatlarini aniqlash, ommaviy ishlarni rejalashtirish, hodisaga javob berish va o'limdan keyingi jarayonga ixtisoslashgan.
Rus tilida gapiradi va dars beradi.

Evgeniy Varavva
Google kompaniyasida bosh dasturchi (San-Fransisko).
Yuqori yuklangan veb-loyihalardan kompyuterni ko'rish va robototexnika sohasidagi tadqiqotlargacha bo'lgan tajriba.
2011-yildan boshlab u Google’da taqsimlangan tizimlarni yaratish va ishlatish bilan shug‘ullanib, loyihaning to‘liq hayotiy siklida: kontseptualizatsiya, dizayn va arxitektura, ishga tushirish, yig‘ish va barcha oraliq bosqichlarda ishtirok etadi.

Eduard Medvedev
Volfram laboratoriyasining texnik direktori (Germaniya)
StackStorm’da muhandis bo‘lib ishlagan, platformaning ChatOps funksiyasi uchun mas’ul. Ma'lumotlar markazini avtomatlashtirish uchun ChatOps ishlab chiqilgan va joriy qilingan. Rossiya va xalqaro konferentsiyalarda ma'ruzachi.

Dastur

Dastur faol ishlab chiqilmoqda. Endi shunday ko'rinadi, fevralgacha u yaxshilanishi va kengayishi mumkin.

1-mavzu: SREning asosiy tamoyillari va usullari

  • SRE bo'lish uchun nima kerak?
  • DevOps va SRE
  • Nima uchun ishlab chiquvchilar SRE-ni qadrlashadi va ular loyihada bo'lmaganlarida juda xafa bo'lishadi
  • SLI, SLO va SLA
  • Xato byudjeti va uning SREdagi roli

2-mavzu: Taqsimlangan tizimlarni loyihalash

  • Ilova arxitekturasi va funksionalligi
  • Mavhum bo'lmagan yirik tizim dizayni
  • Ishlash qobiliyati / muvaffaqiyatsizlik uchun dizayn
  • gRPC yoki REST
  • Versiyalash va orqaga qarab muvofiqlik

Mavzu №3: SRE loyihasi qanday qabul qilinadi

  • SRE dan eng yaxshi amaliyotlar
  • Loyihani qabul qilish bo'yicha nazorat ro'yxati
  • Jurnal, ko'rsatkichlar, kuzatish
  • CI/CDni o'z qo'limizga olish

4-mavzu: Taqsimlangan tizimni loyihalash va ishga tushirish

  • Teskari muhandislik - tizim qanday ishlaydi?
  • Biz SLI va SLOga rozimiz
  • Imkoniyatlarni rejalashtirish amaliyoti
  • Ilovaga trafikni ishga tushirgandan so'ng, bizning foydalanuvchilarimiz undan "foydalanishni" boshlaydilar
  • Prometey, Grafana, Elastikni ishga tushirish

Mavzu №5: Monitoring, kuzatish va ogohlantirish

  • Monitoring vs. Kuzatish qobiliyati
  • Prometey yordamida monitoring va ogohlantirishni sozlash
  • SLI va SLOning amaliy monitoringi
  • Semptomlar va boshqalar. Sabablari
  • Qora quti vs. Oq quti monitoringi
  • Ilova va server mavjudligining taqsimlangan monitoringi
  • 4 ta oltin signal (anomaliyani aniqlash)

6-mavzu: Tizim ishonchliligini tekshirish amaliyoti

  • Bosim ostida ishlash
  • Muvaffaqiyatsizlik - in'ektsiya
  • Chaos Maymun

Mavzu №7: Hodisalarga javob berish amaliyoti

  • Stressni boshqarish algoritmi
  • Voqea ishtirokchilari o'rtasidagi o'zaro munosabatlar
  • O'limdan keyingi
  • Bilim almashish
  • Madaniyatni shakllantirish
  • Xato monitoringi
  • Aybsiz brifing o'tkazish

8-mavzu: Yuklarni boshqarish amaliyoti

  • Yukni muvozanatlash
  • Ilovaning nosozlikka bardoshliligi: qayta urinish, vaqt tugashi, nosozlik in'ektsiyasi, elektron to'xtatuvchidir
  • DDoS (yuk yaratish) + Kaskadli nosozliklar

9-mavzu: Hodisaga javob

  • Debrifing
  • Qo'ng'iroq bo'yicha amaliyot
  • Har xil turdagi baxtsiz hodisalar (sinov, konfiguratsiyani o'zgartirish, apparatdagi nosozlik)
  • Hodisalarni boshqarish protokollari

Mavzu №10: Diagnostika va muammolarni hal qilish

  • Jurnal yozish
  • Nosozliklarni tuzatish
  • Ilovamizda tahlil qilish va tuzatishni mashq qiling

Mavzu №11: Tizim ishonchliligini tekshirish

  • Stress testi
  • Konfiguratsiya sinovi
  • Ishlash testi
  • Kanareyka chiqarilishi

12-mavzu: Mustaqil ish va takrorlash

Ishtirokchilar uchun tavsiyalar va talablar

SRE - bu jamoaviy harakat. Kursni jamoa sifatida qabul qilishni tavsiya etamiz. Shuning uchun biz tayyor jamoalar uchun katta chegirmalar taklif qilamiz.

Kurs narxi bir kishi uchun 60 000 ₽.
Agar kompaniya 5+ kishidan iborat guruhni yuborsa - 40 000 ₽.

Kurs Kubernetes asosida qurilgan. O'tish uchun siz Kubernetesni asosiy darajada bilishingiz kerak. Agar siz u bilan ishlamasangiz, Slurm Basic-dan o'tishingiz mumkin (онлайн yoki intensiv 18-20 noyabr).
Bundan tashqari, siz Linuxda malakali bo'lishingiz va Gitlab va Prometeyni bilishingiz kerak.

Ro'yxatga olish

Agar sizda ishtirok etish uchun murakkab g'oyangiz bo'lsa, masalan, bosh direktor, texnik direktor va ishlab chiquvchilar guruhi kursga kelishi va ular boshqaruv vertikalini hisobga olgan holda amaliyot o'tashi uchun menga shaxsiy xabarda yozing.

Manba: www.habr.com

a Izoh qo'shish