Online SRE intensief: we breken alles tot op de grond af, dan repareren we het, nog een paar keer breken we het af, en dan bouwen we het weer op

Laten we iets breken, okΓ©? Anders bouwen en bouwen, repareren en repareren. Sterfelijke verveling.

Laten we het breken, zodat er niets met ons gebeurt - niet alleen zullen we geprezen worden voor deze schande. En dan gaan we alles opnieuw bouwen – zozeer zelfs dat het een orde van grootte beter, fouttoleranter en sneller zal zijn.

En we zullen het opnieuw breken.

Denk je dat dit een wedstrijd is om het meest geheime instrument van onze hele ruimtevaart te gebruiken: de Grote Russische Ruimtehamer?

Nee, dit is een online SRE-intensief. Het gebeurde gewoon zo dat elke cursus Slurm SRE nooit en nooit zoals de vorige. Simpelweg omdat je nooit raadt dat in een enorm complex systeem, waarmee duizenden en duizenden gebruikers elke seconde verbinding maken, en het publiek zelf uit enkele miljoenen bestaat, het eraf kan vallen, kapot kan gaan, saai kan worden, kan haperen en op honderden andere manieren kapot kan gaan. de sfeer van de dienstverschuiving van SRE-ingenieurs.

In december houden we er weer een SRE intensief.

Online SRE intensief: we breken alles tot op de grond af, dan repareren we het, nog een paar keer breken we het af, en dan bouwen we het weer op

Laten we een kleine terugblik doen. Bedenk hoe HR een paar jaar geleden nog racete om te zien wie de meeste DevOps-ingenieurs in hun bedrijf kon inhuren. De prijs is veranderd. Nu inspecteren ze, net als het Pantsir-S1-volgsysteem, de omringende ruimte en zoeken ze naar SRE-ingenieurs. Ik sprak in het artikel β€œEvgeniy Varavva, ontwikkelaar bij Google. Zo omschrijf je Google in 5 woordenβ€œHoe het leven is voor een SRE-ingenieur bij Google, en hoe zelfs zo’n bedrijf een tekort aan SRE-specialisten ervaart.

Op de online intensief Slurm SRE in december leer je in drie dagen, van 10 tot 00 uur, hoe je de snelheid, fouttolerantie en beschikbaarheid van websites kunt garanderen in omstandigheden met beperkte middelen, IT-incidenten kunt elimineren en debriefing kunt uitvoeren zodat problemen zich niet herhalen.

Cursussprekers:

Ivan Kruglov. Staff Software Engineer bij Databricks. Heeft ervaring bij grote bedrijven op het gebied van gedistribueerde bezorging en verwerking van berichten, BigData en web-stack, zoeken, het bouwen van een interne cloud, service mesh.

Pavel Selivanov. Senior DevOps Engineer bij Mail.ru Cloud Solutions. Ik heb tientallen gebouwde infrastructuren en honderden geschreven CI/CD-pijplijnen. Gecertificeerde Kubernetes-beheerder. Auteur van diverse cursussen over Kubernetes en DevOps. Regelmatige spreker op Russische en internationale IT-conferenties.

Alles zal zwaar, onvoorspelbaar en in de praktijk zijn. Je gaat bouwen, afbreken en repareren - en soms in heel verschillende volgordes.

Bouwen: Je zult SLO-, SLI-, SLA-indicatoren moeten formuleren voor een site die uit verschillende microservices bestaat; de architectuur en infrastructuur ontwikkelen die hen zullen ondersteunen; de locatie monteren, testen en inzetten; monitoring en waarschuwingen instellen.

Pauze: Je houdt rekening met interne en externe factoren die de SLO verslechteren: ontwikkelaarsfouten, infrastructuurstoringen, toestroom van bezoekers, DoS-aanvallen. Leer de robuustheid, het foutenbudget, de testpraktijken, het interruptbeheer en de operationele werklast begrijpen.

Reparatie: Je wordt getraind om het werk van een team snel en effectief te organiseren om een ​​ongeval in de kortst mogelijke tijd te elimineren: betrek collega's, informeer belanghebbenden en stel prioriteiten.

Studie: Je kunt de aanpak van de site analyseren vanuit een SRE-oogpunt. Analyseer incidenten. Bepaal hoe u ze in de toekomst kunt vermijden: verbeter de monitoring, verander de architectuur, benaderingen van ontwikkeling en exploitatie, regelgeving. Automatiseer processen.

Online SRE-intensief simuleert echte omstandigheden - de tijd om de service te herstellen zal uiterst beperkt zijn. Net als in het echte leven, net als in een echte werksituatie.

U kunt de voorwaarden van de SRE-cursus vinden en het volledige programma bestuderen op link.

De online intensive staat gepland voor december 2020. Voor degenen die vooraf betalen voor deelname, hebben we een korting voorbereid.

Bent u klaar voor intensieve training, niet-standaard taken en plotselinge ongelukken?

Het zal gewoon niet gebeuren. Er zal professionele groei plaatsvinden.

Bron: www.habr.com

Voeg een reactie