А давайте-ка что-нибудь сломаем? А то всё строим и строим, чиним и чиним. Скука смертная.
Давайте сломаем так, чтобы нам за это ничего не было — мало того, чтобы нас за это безобразие ещё и похвалили. А потом заново всё построим — да так, что будет на порядок лучше, отказоустойчивей и быстрее.
И снова сломаем.
Думаете, это конкурс по применению самого секретного инструмента всей нашей космонавтики — Big Russian Space Hammer?
Нет, это онлайн-интенсив SRE. Так уж получилось, что каждый курс
В декабре мы проведём очередной
Устроим небольшую ретроспективу. Вспомните, как всего лишь несколько лет назад HR устраивали забеги наперегонки, кто ухватит в свою компанию побольше DevOps-инженеров. Приз поменялся. Теперь они, как следящая система «Панцирь-С1», осматривают окружающее пространство, выискивают SRE-инженеров. Я рассказывал в статье «
На онлайн интенсиве
Спикеры курса:
Иван Круглов. Staff Software Engineer в Databricks. Имеет опыт в enterprise компаниях по распределенной доставке и обработке сообщений, BigData и web-stack, поиску, построению внутреннего облака, service mesh.
Павел Селиванов. Senior DevOps Engineer в Mail.ru Cloud Solutions. На счету десятки выстроенных инфраструктур и сотни написанных пайплайнов CI/CD. Сертифицированный администратор Kubernetes. Автор нескольких курсов по Kubernetes и DevOps. Регулярный докладчик на Российских и международных IT конференциях.
Всё будет проходить жёстко, непредсказуемо и на практике. Вы будете строить, ломать и чинить — причём порой в самых разных последовательностях.
Строить: Вам предстоит сформулировать показатели SLO, SLI, SLA для сайта, состоящего из нескольких микросервисов; разработать архитектуру и инфраструктуру, которая их обеспечит; собрать, протестировать и задеплоить сайт; настроить мониторинг и алертинг.
Ломать: Вы рассмотрите внутренние и внешние факторы ухудшения SLO: ошибки разработчиков, отказы инфраструктуры, наплыв посетителей, DoS-атаки. Научитесь разбираться в устойчивости, error budget, практике тестирования, управлении прерываниями и с операционной нагрузкой.
Чинить: Вас натренируют быстро и эффективно организовать работу группы по ликвидации аварии в минимальные сроки: подключить коллег, оповестить интересантов (stakeholders), выстроить приоритеты.
Изучать: Вы сможете разобрать подход к сайту с точки зрения SRE. Проанализировать инциденты. Определить, как избежать их в будущем: улучшить мониторинг, изменить архитектуру, подходы к разработке и эксплуатации, регламенты. Автоматизировать процессы.
Узнать условия курса SRE, а также изучить полную программу можно по
Онлайн-интенсив запланирован на декабрь 2020 года. Для тех, кто оплатит участие заранее, мы подготовили скидку.
Готовы к напряжённому обучению, нестандартным задачам и внезапным авариям?
Просто — не будет. Будет профессиональный рост.
Источник: habr.com