Poďme niečo rozbiť, dobre? Inak staviame a staviame, opravujeme a opravujeme. Smrteľná nuda.
Zlomme to, aby sa nám za to nič nestalo – nielen že budeme za túto hanbu pochválení. A potom všetko postavíme znova – natoľko, že to bude rádovo lepšie, odolnejšie voči chybám a rýchlejšie.
A znova to zlomíme.
Myslíte si, že ide o súťaž v použití najtajnejšieho nástroja celej našej kozmonautiky – Veľkého ruského vesmírneho kladiva?
Nie, toto je online intenzívna SRE. Stalo sa tak, že každý kurz
V decembri usporiadame ďalší
Urobme si malú retrospektívu. Pamätajte si, ako sa len pred niekoľkými rokmi HR pretekali, kto dokáže najať najviac inžinierov DevOps do ich spoločnosti. Cena sa zmenila. Teraz, podobne ako sledovací systém Pantsir-S1, kontrolujú okolitý priestor a hľadajú inžinierov SRE. Hovoril som v článku "
Na online intenzívnom
Prednášajúci kurzu:
Ivan Kruglov. Staff Software Engineer v Databricks. Má skúsenosti v podnikových spoločnostiach s distribuovaným doručovaním a spracovaním správ, BigData a web-stack, vyhľadávanie, budovanie interného cloudu, sieť služieb.
Pavel Selivanov. Senior DevOps Engineer v Cloud Solutions Mail.ru. Mám desiatky vybudovaných infraštruktúr a stovky napísaných kanálov CI/CD. Certifikovaný správca Kubernetes. Autor niekoľkých kurzov na Kubernetes a DevOps. Pravidelný rečník na ruských a medzinárodných IT konferenciách.
Všetko bude ťažké, nepredvídateľné a v praxi. Budete stavať, lámať a opravovať – a niekedy vo veľmi odlišných postupnostiach.
Zostava: Budete musieť formulovať ukazovatele SLO, SLI, SLA pre stránku pozostávajúcu z niekoľkých mikroslužieb; rozvíjať architektúru a infraštruktúru, ktorá ich bude podporovať; zostaviť, otestovať a nasadiť lokalitu; nastaviť monitorovanie a upozorňovanie.
Prestávka: Zohľadníte interné a externé faktory, ktoré zhoršujú SLO: chyby vývojárov, zlyhania infraštruktúry, prílev návštevníkov, DoS útoky. Naučte sa porozumieť robustnosti, chybovému rozpočtu, testovacím postupom, správe prerušení a prevádzkovej záťaži.
Oprava: Budete vyškolení, ako rýchlo a efektívne organizovať prácu tímu na odstránenie nehody v čo najkratšom čase: zapojiť kolegov, informovať zainteresované strany a stanoviť priority.
štúdium: Budete vedieť analyzovať prístup k stránke z pohľadu SRE. Analyzujte incidenty. Zistite, ako sa im v budúcnosti vyhnúť: zlepšiť monitorovanie, zmeniť architektúru, prístupy k vývoju a prevádzke, predpisy. Automatizujte procesy.
Podmienky kurzu SRE, ako aj štúdium celého programu nájdete na
Online intenzívna je naplánovaná na december 2020. Pre tých, ktorí si zaplatia účasť vopred, sme pripravili zľavu.
Ste pripravení na intenzívny tréning, neštandardné úlohy a náhle nehody?
To sa jednoducho nestane. Dôjde k odbornému rastu.
Zdroj: hab.com