Slurm SRE - učenie na zabezpečenie spokojnosti používateľov

Slurm SRE - učenie na zabezpečenie spokojnosti používateľov

Slurm SRE začína v Moskve 3. februára.

Toto je prvý intenzívny program, pri ktorom sme sa vzdialili od schémy „Opakujte po učiteľovi“. Nájdete prácu v projekte SRE, čo najbližšie k bojovým podmienkam.

Dostanete do rúk plnohodnotný pracovný projekt a budete s ním pracovať v reálnom čase. Čaká vás typická úloha SRE: práca s neznámym kódom, problémy so synchronizáciou distribuovaných systémov, problémy s komunikáciou s kolegami.

Nájdete netriviálne zlyhania systému prevzaté z reálneho života. (Z času na čas od rečníkov počujem: „Kolegovia, prepáčte, v najbližších dvoch dňoch sa nebudem môcť zúčastniť stretnutí, ale pre náš program sa objavil vynikajúci prípad“).

Incidenty sa budú vyvíjať rýchlo, keďže každá sekunda je pre našu cvičnú spoločnosť stratený zisk.

Účastníkov rozdelíme do tímov. Každý tím bude mať mentora, jedného z prednášajúcich. Každý tím je zodpovedný za svoj vlastný backend. Ako sa incidenty vyvíjajú, budete musieť organizovať prácu svojho tímu a komunikovať s ostatnými tímami. Hráme podľa skóre: rozhodcovia budú odpočítavať a pridávať body, aby tím videl, aké adekvátne a efektívne sú jeho akcie. A na záver vyhlásime víťaza.

Po každom incidente bude prebiehať brífing, kde identifikujeme a opravíme systémové problémy v procesoch. Mentori zabezpečia súlad s bezúhonnou kultúrou postmortem. V našej oblasti sa bezúhonný prístup zatiaľ veľmi nerozšíril, no je to jeden z kľúčov k implementácii SRE a DevOps.

Očakávame, že do troch dní dosiahneme globálnu zmenu paradigmy: naučíme vás myslieť ako inžinier SRE a pozerať sa na projekt ako inžinier SRE.

Na účasť budete potrebovať laptop, náhlavnú súpravu a základné znalosti Kubernetes. Ak neexistuje posledný bod, môžete absolvovať online kurz v zostávajúcom čase Slurm Kubernetes.

registrácia tu.

Zdroj: hab.com

Pridať komentár