"Нада је лоша стратегија." СРЕ интензив у Москви, 3-5 фебруара

Најављујемо први практични курс о СРЕ у Русији: Слурм СРЕ.

Током интензивног трајања провешћемо три дана у изградњи, ломљењу, поправљању и побољшању веб сајта агрегатора за продају карата за биоскоп.

"Нада је лоша стратегија." СРЕ интензив у Москви, 3-5 фебруара

Изабрали смо агрегатор карата јер има много сценарија неуспеха: прилив посетилаца и ДДоС нападе, отказ једног од многих критичних микросервиса (ауторизација, резервације, обрада плаћања), недоступност једног од бројних биоскопа (размена података о слободна места и резервације) и даље на листи.

Формулисаћемо концепт поузданости за наш агрегатор сајт, који ћемо даље развијати у инжењерингу, анализирати дизајн са становишта СРЕ, одабрати метрике, поставити њихово праћење, елиминисати инциденте који се појављују, спровести обуку за тимски рад са инцидентима у условима блиским борбеним, организовати дебрифинг .

Програм воде запослени на Боокинг.цом-у и Гоогле-у.
Овог пута неће бити учешћа на даљину: курс је изграђен на личној интеракцији и тимском раду.

Детаљи испод реза

Звучници

Иван Круглов
Главни програмер на Боокинг.цом (Холандија)
Откако се придружио Боокинг.цом-у 2013. године, радио је на инфраструктурним пројектима као што су дистрибуирана испорука и обрада порука, БигДата и веб-стацк, претрага.
Тренутно ради на питањима изградње интерног облака и сервисне мреже.

Бен Тилер
Главни програмер на Боокинг.цом (САД)
Ангажован на интерном развоју платформе Боокинг.цом.
Специјализован је за сервисну мрежу / откривање сервиса, заказивање групних послова, одговор на инциденте и постмортем процес.
Говори и предаје на руском.

Евгениј Варавва
Генерални програмер у Гоогле-у (Сан Франциско).
Искуство од великих веб пројеката до истраживања компјутерског вида и роботике.
Од 2011. године је укључен у креирање и рад дистрибуираних система у Гоогле-у, учествујући у пуном животном циклусу пројекта: концептуализација, дизајн и архитектура, лансирање, склапање и све међуфазе.

Едуард Медведев
ЦТО у Тунгстен Лабс (Немачка)
Радио је као инжењер у СтацкСторм-у, одговоран за ЦхатОпс функционалност платформе. Развијен и имплементиран ЦхатОпс за аутоматизацију дата центара. Говорник на руским и међународним конференцијама.

Програм

Програм се активно развија. Сада то изгледа овако, до фебруара би се могло побољшати и проширити.

Тема #1: Основни принципи и методе СРЕ

  • Шта је потребно да постанете СРЕ?
  • ДевОпс против СРЕ
  • Зашто програмери цене СРЕ и веома су тужни када нису у пројекту
  • СЛИ, СЛО и СЛА
  • Буџет грешке и његова улога у СРЕ

Тема #2: Дизајн дистрибуираних система

  • Архитектура и функционалност апликације
  • Неапстрактни дизајн великог система
  • Оперативност / Дизајн за отказ
  • гРПЦ или РЕСТ
  • Версионирање и компатибилност уназад

Тема #3: Како се СРЕ пројекат прихвата

  • Најбоље праксе из СРЕ-а
  • Контролна листа прихватања пројекта
  • Евидентирање, метрика, праћење
  • Узимамо ЦИ/ЦД у своје руке

Тема број 4: Дизајн и покретање дистрибуираног система

  • Обрнути инжењеринг - како систем функционише?
  • Слажемо се око СЛИ и СЛО
  • Вежбајте планирање капацитета
  • Покрећући саобраћај ка апликацији, наши корисници почињу да је „користе“.
  • Лансирање Прометхеус, Графана, Еластиц

Тема #5: Надгледање, уочљивост и упозорење

  • Мониторинг вс. Опсервабилити
  • Подешавање праћења и упозоравања са Прометејем
  • Практично праћење СЛИ и СЛО
  • Симптоми вс. Узроци
  • Блацк-Бок вс. Праћење беле кутије
  • Дистрибуирано праћење доступности апликација и сервера
  • 4 златна сигнала (детекција аномалија)

Тема бр. 6: Пракса испитивања поузданости система

  • Радити под притиском
  • Фаилуре-ињецтион
  • Хаос мајмун

Тема #7: Пракса реаговања на инциденте

  • Алгоритам управљања стресом
  • Интеракција између учесника инцидента
  • Постмортем
  • Дељење знања
  • Обликовање културе
  • Праћење квара
  • Спровођење беспрекорног испитивања

Тема #8: Праксе управљања оптерећењем

  • Балансирање оптерећења
  • Толеранција грешака апликације: поновни покушај, временско ограничење, убризгавање грешке, прекидач
  • ДДоС (креирање оптерећења) + каскадни неуспеси

Тема #9: Одговор на инциденте

  • Дебриефинг
  • Дежурна пракса
  • Разне врсте незгода (тестирање, промене конфигурације, квар хардвера)
  • Протоколи за управљање инцидентима

Тема #10: Дијагноза и решавање проблема

  • Логгинг
  • Отклањање грешака
  • Вежбајте анализу и отклањање грешака у нашој апликацији

Тема #11: Тестирање поузданости система

  • Тестирање на стрес
  • Тестирање конфигурације
  • Тестирање перформанси
  • Цанари релеасе

Тема број 12: Самостални рад и смотра

Препоруке и захтеви за учеснике

СРЕ је тимски рад. Топло препоручујемо да похађате курс као тим. Зато нудимо велике попусте за готове тимове.

Цена курса је 60 ₽ по особи.
Ако компанија шаље групу од 5+ људи - 40 ₽.

Курс је изграђен на Кубернетесу. Да бисте прошли, морате да познајете Кубернетес на основном нивоу. Ако не радите са њим, можете проћи кроз Слурм Басиц (Онлајн или интензивни 18-20 новембар).
Поред тога, морате бити вешти у Линук-у и познавати Гитлаб и Прометхеус.

регистрација

Ако имате комплексну идеју за учешће, на пример, да на курс дођу ЦЕО, ЦТО и тим програмера и да они прођу праксу узимајући у обзир вертикалу менаџмента, пишите ми у личну поруку.

Извор: ввв.хабр.цом

Додај коментар