Online SRE intenzívne: všetko rozoberieme do základov, potom to opravíme, ešte párkrát to rozbijeme a potom to postavíme znova

Poďme niečo rozbiť, dobre? Inak staviame a staviame, opravujeme a opravujeme. Smrteľná nuda.

Zlomme to, aby sa nám za to nič nestalo – nielen že budeme za túto hanbu pochválení. A potom všetko postavíme znova – natoľko, že to bude rádovo lepšie, odolnejšie voči chybám a rýchlejšie.

A znova to zlomíme.

Myslíte si, že ide o súťaž v použití najtajnejšieho nástroja celej našej kozmonautiky – Veľkého ruského vesmírneho kladiva?

Nie, toto je online intenzívna SRE. Stalo sa tak, že každý kurz Slurm SRE nikdy a nikdy ako ten predchádzajúci. Jednoducho preto, že nikdy neuhádnete, že v obrovskom komplexnom systéme, ku ktorému sa každú sekundu pripájajú tisíce a tisíce používateľov a samotné publikum má niekoľko miliónov, môže spadnúť, zlomiť sa, otupiť, pokaziť a stovkami ďalších spôsobov zničiť nálada pracovnej zmeny inžinierov SRE.

V decembri usporiadame ďalší SRE intenzívne.

Online SRE intenzívne: všetko rozoberieme do základov, potom to opravíme, ešte párkrát to rozbijeme a potom to postavíme znova

Urobme si malú retrospektívu. Pamätajte si, ako sa len pred niekoľkými rokmi HR pretekali, kto dokáže najať najviac inžinierov DevOps do ich spoločnosti. Cena sa zmenila. Teraz, podobne ako sledovací systém Pantsir-S1, kontrolujú okolitý priestor a hľadajú inžinierov SRE. Hovoril som v článku "Evgeniy Varavva, vývojár v spoločnosti Google. Ako opísať Google 5 slovami„Aký je život inžiniera SRE v spoločnosti Google a ako aj takáto spoločnosť pociťuje nedostatok špecialistov na SRE.

Na online intenzívnom Slurm SRE decembra sa za tri dni v čase od 10:00 do 19:00 dozviete, ako zabezpečiť rýchlosť, chybovosť a dostupnosť webových stránok v podmienkach obmedzených zdrojov, eliminovať IT incidenty a vykonávať debriefing tak, aby sa problémy neopakovali.

Prednášajúci kurzu:

Ivan Kruglov. Staff Software Engineer v Databricks. Má skúsenosti v podnikových spoločnostiach s distribuovaným doručovaním a spracovaním správ, BigData a web-stack, vyhľadávanie, budovanie interného cloudu, sieť služieb.

Pavel Selivanov. Senior DevOps Engineer v Cloud Solutions Mail.ru. Mám desiatky vybudovaných infraštruktúr a stovky napísaných kanálov CI/CD. Certifikovaný správca Kubernetes. Autor niekoľkých kurzov na Kubernetes a DevOps. Pravidelný rečník na ruských a medzinárodných IT konferenciách.

Všetko bude ťažké, nepredvídateľné a v praxi. Budete stavať, lámať a opravovať – a niekedy vo veľmi odlišných postupnostiach.

Zostava: Budete musieť formulovať ukazovatele SLO, SLI, SLA pre stránku pozostávajúcu z niekoľkých mikroslužieb; rozvíjať architektúru a infraštruktúru, ktorá ich bude podporovať; zostaviť, otestovať a nasadiť lokalitu; nastaviť monitorovanie a upozorňovanie.

Prestávka: Zohľadníte interné a externé faktory, ktoré zhoršujú SLO: chyby vývojárov, zlyhania infraštruktúry, prílev návštevníkov, DoS útoky. Naučte sa porozumieť robustnosti, chybovému rozpočtu, testovacím postupom, správe prerušení a prevádzkovej záťaži.

Oprava: Budete vyškolení, ako rýchlo a efektívne organizovať prácu tímu na odstránenie nehody v čo najkratšom čase: zapojiť kolegov, informovať zainteresované strany a stanoviť priority.

štúdium: Budete vedieť analyzovať prístup k stránke z pohľadu SRE. Analyzujte incidenty. Zistite, ako sa im v budúcnosti vyhnúť: zlepšiť monitorovanie, zmeniť architektúru, prístupy k vývoju a prevádzke, predpisy. Automatizujte procesy.

Online SRE Intensive simuluje reálne podmienky – čas na obnovenie služby bude extrémne obmedzený. Rovnako ako v reálnom živote, rovnako ako v skutočnej pracovnej situácii.

Podmienky kurzu SRE, ako aj štúdium celého programu nájdete na odkaz.

Online intenzívna je naplánovaná na december 2020. Pre tých, ktorí si zaplatia účasť vopred, sme pripravili zľavu.

Ste pripravení na intenzívny tréning, neštandardné úlohy a náhle nehody?

To sa jednoducho nestane. Dôjde k odbornému rastu.

Zdroj: hab.com

Pridať komentár