Онлайн-інтенсив SRE: все зламаємо вщент, потім полагодимо, ще пару разів зламаємо, а потім збудуємо заново

А давайте щось зламаємо? А то все будуємо і будуємо, чиним і чиним. Нудьга смертна.

Давайте зламаємо так, щоб нам за це нічого не було — мало того, щоби нас за це неподобство ще й похвалили. А потім знову все побудуємо — та так, що буде на порядок краще, відмовостійкіше і швидше.

І знову зламаємо.

Думаєте, це конкурс із застосування найтаємнішого інструменту всієї нашої космонавтики — Big Russian Space Hammer?

Ні, це онлайн-інтенсив SRE. Так вийшло, що кожен курс Слерм SRE ніколи і нізащо не схожий на попередній. Просто тому, що ніколи не вгадаєш, що у величезній складній системі, до якої щосекунди підключаються тисячі і тисячі користувачів, а сама аудиторія становить кілька мільйонів, може відвалитися, зламатися, затупити, заглючити і ще сотнями способів зіпсувати настрій чергової зміни SRE-інженерів.

У грудні ми проведемо черговий інтенсив по SRE.

Онлайн-інтенсив SRE: все зламаємо вщент, потім полагодимо, ще пару разів зламаємо, а потім збудуємо заново

Влаштуємо невелику ретроспективу. Згадайте, як лише кілька років тому HR влаштовували забіги наввипередки, хто вхопить у свою компанію більше DevOps-інженерів. Приз змінився. Тепер вони, як система «Панцир-С1», що стежить, оглядають навколишній простір, вишукують SRE-інженерів. Я розповідав у статті «Євген Варавва, розробник у Google. Як описати Google у 5 словах», як живеться SRE-інженеру в Google, і як навіть така корпорація відчуває дефіцит у SRE-фахівцях.

На онлайн інтенсиві Слерм SRE у грудні за три дні, з 10:00 до 19:00, ви навчитеся забезпечувати швидкодію, відмовостійкість та доступність сайтів в умовах обмежених ресурсів, ліквідувати IT-інциденти та проводити розбір польотів так, щоб проблеми не повторювалися.

Спікери курсу:

Іван Круглов. Staff Software Engineer у Databricks. Має досвід у enterprise компаніях з розподіленої доставки та обробки повідомлень, BigData та web-stack, пошуку, побудові внутрішньої хмари, service mesh.

Павло Селіванов. Senior DevOps Engineer у Mail.ru Cloud Solutions. На рахунку десятки збудованих інфраструктур та сотні написаних пайплайнів CI/CD. Сертифікований адміністратор Kubernetes. Автор кількох курсів з Kubernetes та DevOps. Регулярний доповідач на Російських та міжнародних IT конференціях.

Все проходитиме жорстко, непередбачено і на практиці. Ви будуватимете, ламатимете і лагодитимете — причому часом у різних послідовностях.

Будувати: Ви повинні сформулювати показники SLO, SLI, SLA для сайту, що складається з декількох мікросервісів; розробити архітектуру та інфраструктуру, яка їх забезпечить; зібрати, протестувати та задеплоїти сайт; налаштувати моніторинг та аллертинг.

Ломати: Ви розгляньте внутрішні та зовнішні фактори погіршення SLO: помилки розробників, відмови інфраструктури, наплив відвідувачів, DoS-атаки. Навчіться розбиратися у стійкості, error budget, практиці тестування, управлінні перериваннями та з операційним навантаженням.

Чинити: Вас натренують швидко та ефективно організувати роботу групи з ліквідації аварії у мінімальні терміни: підключити колег, сповістити інтересантів (stakeholders), вибудувати пріоритети.

Вивчати: Ви зможете розібрати підхід до сайту з погляду SRE. Проаналізувати інциденти. Визначити, як уникнути їх у майбутньому: покращити моніторинг, змінити архітектуру, підходи до розробки та експлуатації, регламенти. Автоматизувати процеси.

Онлайн-інтенсив SRE імітує реальні умови — час відновлення працездатності сервісу буде обмежено. Як у справжньому житті, як у реальній робочій ситуації.

Дізнатися про умови курсу SRE, а також вивчити повну програму можна по за посиланням.

Онлайн-інтенсив заплановано на грудень 2020 року. Для тих, хто сплатить заздалегідь участь, ми підготували знижку.

Готові до напруженого навчання, нестандартних завдань та раптових аварій?

Просто не буде. Буде професійне зростання.

Джерело: habr.com

Додати коментар або відгук