Slurm SRE - učení k zajištění spokojenosti uživatelů

Slurm SRE - učení k zajištění spokojenosti uživatelů

Slurm SRE začíná v Moskvě 3. února.

Toto je první intenzivní, kde jsme se vzdali schématu „Opakujte po učiteli“. Najdete práci v projektu SRE, co nejblíže bojovým podmínkám.

Dostanete do rukou plnohodnotný pracovní projekt a budete s ním pracovat v reálném čase. Čeká vás typický úkol SRE: práce s neznámým kódem, problémy se synchronizací distribuovaných systémů, potíže s komunikací s kolegy.

Najdete netriviální selhání systému převzatá z reálného života. (Čas od času slyším od řečníků: „Kolegové, omlouvám se, nebudu se moci zúčastnit schůzí v příštích dvou dnech, ale pro náš program se objevil vynikající případ“).

Incidenty se budou rychle vyvíjet, vzhledem k tomu, že každá sekunda je pro naši školicí společnost ušlý zisk.

Účastníky rozdělíme do týmů. Každý tým bude mít svého mentora, jednoho z řečníků kurzu. Každý tým je zodpovědný za svůj vlastní backend. Jak se incidenty vyvíjejí, budete muset organizovat práci svého týmu a komunikovat s ostatními týmy. Hrajeme podle skóre: rozhodčí budou odečítat a přidávat body, aby tým viděl, jak adekvátní a efektivní je jeho jednání. A na závěr vyhlásíme vítěze.

Po každém incidentu proběhne debriefing, kde identifikujeme a opravíme systémové problémy v procesech. Mentoři zajistí dodržování bezúhonné kultury postmortem. V naší oblasti se bezúhonný přístup zatím příliš nerozšířil, ale je to jeden z klíčů k implementaci SRE a DevOps.

Očekáváme, že do tří dnů dosáhneme globální změny paradigmatu: naučíme vás myslet jako inženýr SRE a dívat se na projekt jako inženýr SRE.

K účasti budete potřebovat notebook, sluchátka a základní znalosti Kubernetes. Pokud neexistuje žádný poslední bod, můžete ve zbývajícím čase absolvovat online kurz Slurm Kubernetes.

Registrace zde.

Zdroj: www.habr.com

Přidat komentář