Онлайндық SRE қарқынды: біз бәрін жерге дейін бұзамыз, содан кейін оны түзетеміз, оны тағы бірнеше рет бұзамыз, содан кейін оны қайтадан саламыз

Бір нәрсені сындырайық, солай ма? Әйтпесе саламыз, саламыз, жөндеп, жөндейміз. Өлімді скучно.

Бізге ештеңе болмас үшін оны сындырайық - бұл масқара үшін мақтау ғана емес. Содан кейін біз бәрін қайтадан саламыз - бұл жақсырақ, ақауларға төзімді және жылдамырақ болатындай.

Біз оны қайтадан бұзамыз.

Қалай ойлайсыз, бұл біздің бүкіл космонавтиканың ең құпия құралы - Үлкен Ресей ғарыштық балғасын пайдалануға арналған жарыс па?

Жоқ, бұл онлайн SRE қарқынды. Әрбір курс осылай болды Slurm SRE ешқашан және ешқашан бұрынғысын ұнатпайды. Әр секунд сайын мыңдаған және мыңдаған пайдаланушылар қосылатын және аудиторияның өзі бірнеше миллион болатын орасан күрделі жүйеде ол құлап, бұзылып, күңгірт болып, ақауға ұшырауы және жүздеген басқа жолдармен жойылуы мүмкін екенін ешқашан болжай алмайсыз. СРЕ инженерлерінің кезекшілік ауысымының көңіл-күйі.

Желтоқсан айында тағы да өткіземіз SRE қарқынды.

Онлайндық SRE қарқынды: біз бәрін жерге дейін бұзамыз, содан кейін оны түзетеміз, оны тағы бірнеше рет бұзамыз, содан кейін оны қайтадан саламыз

Кішкене ретроспективалық жасайық. Бірнеше жыл бұрын HR өз компаниясына ең көп DevOps инженерлерін кім жалдай алатынын білу үшін қалай жарысқанын есіңізде сақтаңыз. Жүлде өзгерді. Енді Pantsir-S1 бақылау жүйесі сияқты олар қоршаған кеңістікті тексеріп, SRE инженерлерін іздейді. Мен мақалада айттым «Евгений Варавва, Google әзірлеушісі. Google-ды 5 сөзбен қалай сипаттауға болады«Google-дағы SRE инженерінің өмірі қандай және тіпті мұндай корпорацияда SRE мамандарының тапшылығы қалай кездеседі.

Интенсивті онлайн режимінде Slurm SRE желтоқсанда, үш күн ішінде, сағат 10:00-ден 19:00-ге дейін шектеулі ресурстар жағдайында веб-сайттардың жылдамдығын, ақауларға төзімділігін және қолжетімділігін қамтамасыз етуді, АТ инциденттерін жоюды және проблемалар қайталанбауы үшін дебифинг жүргізуді үйренесіз.

Курс спикерлері:

Иван Круглов. Databricks компаниясының бағдарламалық қамтамасыз ету жөніндегі инженері. Кәсіпорын компанияларында таратылған хабарламаларды жеткізу және өңдеу, BigData және веб-стек, іздеу, ішкі бұлтты құру, сервистік торда тәжірибесі бар.

Павел Селиванов. Mail.ru Cloud Solutions компаниясының DevOps аға инженері. Менде ондаған салынған инфрақұрылым және жүздеген жазбаша CI/CD құбырлары бар. Сертификатталған Kubernetes әкімшісі. Kubernetes және DevOps бойынша бірнеше курстардың авторы. Ресейлік және халықаралық IT конференцияларында тұрақты баяндамашы.

Барлығы қиын, болжау мүмкін емес және іс жүзінде болады. Сіз жасайсыз, бұзасыз және жөндейсіз - кейде өте әртүрлі ретпен.

Құру: Бірнеше микросервистерден тұратын сайт үшін SLO, SLI, SLA көрсеткіштерін тұжырымдауға тура келеді; оларға қолдау көрсететін сәулет пен инфрақұрылымды дамыту; сайтты құрастыру, сынау және орналастыру; бақылау мен ескертуді орнату.

Үзіліс: Сіз SLO-ны нашарлататын ішкі және сыртқы факторларды қарастырасыз: әзірлеушілер қателері, инфрақұрылымдық ақаулар, келушілер ағыны, DoS шабуылдары. Тұрақтылықты, қате бюджетін, тестілеу тәжірибесін, үзілістерді басқаруды және операциялық жұмыс жүктемесін түсінуді үйреніңіз.

Жөндеу: Сіз жазатайым оқиғаны қысқа мерзімде жою бойынша топ жұмысын жылдам және тиімді ұйымдастыруға үйренесіз: әріптестерді тарту, мүдделі тараптарды хабардар ету және басымдықтарды белгілеу.

Зерттеу: Сіз SRE тұрғысынан сайтқа көзқарасты талдай аласыз. Оқиғаларды талдаңыз. Болашақта оларды болдырмаудың жолын анықтаңыз: мониторингті жақсарту, архитектураны, әзірлеу мен пайдалану тәсілдерін, ережелерді өзгерту. Процестерді автоматтандыру.

Онлайн SRE қарқынды нақты жағдайларды имитациялайды - қызметті қалпына келтіру уақыты өте шектеулі болады. Нақты өмірдегідей, нақты жұмыс жағдайындағыдай.

Сіз SRE курсының шарттарын біле аласыз, сонымен қатар толық бағдарламаны мына жерден оқи аласыз байланыс.

Онлайн қарқынды 2020 жылдың желтоқсан айына жоспарланған. Қатысу үшін алдын ала төлейтіндер үшін біз жеңілдік дайындадық.

Сіз қарқынды жаттығуларға, стандартты емес тапсырмаларға және күтпеген апаттарға дайынсыз ба?

Бұл жай ғана болмайды. Кәсіби өсу болады.

Ақпарат көзі: www.habr.com

пікір қалдыру