А давайте щось зламаємо? А то все будуємо і будуємо, чиним і чиним. Нудьга смертна.
Давайте зламаємо так, щоб нам за це нічого не було — мало того, щоби нас за це неподобство ще й похвалили. А потім знову все побудуємо — та так, що буде на порядок краще, відмовостійкіше і швидше.
І знову зламаємо.
Думаєте, це конкурс із застосування найтаємнішого інструменту всієї нашої космонавтики — Big Russian Space Hammer?
Ні, це онлайн-інтенсив SRE. Так вийшло, що кожен курс
У грудні ми проведемо черговий
Влаштуємо невелику ретроспективу. Згадайте, як лише кілька років тому HR влаштовували забіги наввипередки, хто вхопить у свою компанію більше DevOps-інженерів. Приз змінився. Тепер вони, як система «Панцир-С1», що стежить, оглядають навколишній простір, вишукують SRE-інженерів. Я розповідав у статті «
На онлайн інтенсиві
Спікери курсу:
Іван Круглов. Staff Software Engineer у Databricks. Має досвід у enterprise компаніях з розподіленої доставки та обробки повідомлень, BigData та web-stack, пошуку, побудові внутрішньої хмари, service mesh.
Павло Селіванов. Senior DevOps Engineer у Mail.ru Cloud Solutions. На рахунку десятки збудованих інфраструктур та сотні написаних пайплайнів CI/CD. Сертифікований адміністратор Kubernetes. Автор кількох курсів з Kubernetes та DevOps. Регулярний доповідач на Російських та міжнародних IT конференціях.
Все проходитиме жорстко, непередбачено і на практиці. Ви будуватимете, ламатимете і лагодитимете — причому часом у різних послідовностях.
Будувати: Ви повинні сформулювати показники SLO, SLI, SLA для сайту, що складається з декількох мікросервісів; розробити архітектуру та інфраструктуру, яка їх забезпечить; зібрати, протестувати та задеплоїти сайт; налаштувати моніторинг та аллертинг.
Ломати: Ви розгляньте внутрішні та зовнішні фактори погіршення SLO: помилки розробників, відмови інфраструктури, наплив відвідувачів, DoS-атаки. Навчіться розбиратися у стійкості, error budget, практиці тестування, управлінні перериваннями та з операційним навантаженням.
Чинити: Вас натренують швидко та ефективно організувати роботу групи з ліквідації аварії у мінімальні терміни: підключити колег, сповістити інтересантів (stakeholders), вибудувати пріоритети.
Вивчати: Ви зможете розібрати підхід до сайту з погляду SRE. Проаналізувати інциденти. Визначити, як уникнути їх у майбутньому: покращити моніторинг, змінити архітектуру, підходи до розробки та експлуатації, регламенти. Автоматизувати процеси.
Дізнатися про умови курсу SRE, а також вивчити повну програму можна по
Онлайн-інтенсив заплановано на грудень 2020 року. Для тих, хто сплатить заздалегідь участь, ми підготували знижку.
Готові до напруженого навчання, нестандартних завдань та раптових аварій?
Просто не буде. Буде професійне зростання.
Джерело: habr.com