Laten we iets breken, okΓ©? Anders bouwen en bouwen, repareren en repareren. Sterfelijke verveling.
Laten we het breken, zodat er niets met ons gebeurt - niet alleen zullen we geprezen worden voor deze schande. En dan gaan we alles opnieuw bouwen β zozeer zelfs dat het een orde van grootte beter, fouttoleranter en sneller zal zijn.
En we zullen het opnieuw breken.
Denk je dat dit een wedstrijd is om het meest geheime instrument van onze hele ruimtevaart te gebruiken: de Grote Russische Ruimtehamer?
Nee, dit is een online SRE-intensief. Het gebeurde gewoon zo dat elke cursus
In december houden we er weer een
Laten we een kleine terugblik doen. Bedenk hoe HR een paar jaar geleden nog racete om te zien wie de meeste DevOps-ingenieurs in hun bedrijf kon inhuren. De prijs is veranderd. Nu inspecteren ze, net als het Pantsir-S1-volgsysteem, de omringende ruimte en zoeken ze naar SRE-ingenieurs. Ik sprak in het artikel β
Op de online intensief
Cursussprekers:
Ivan Kruglov. Staff Software Engineer bij Databricks. Heeft ervaring bij grote bedrijven op het gebied van gedistribueerde bezorging en verwerking van berichten, BigData en web-stack, zoeken, het bouwen van een interne cloud, service mesh.
Pavel Selivanov. Senior DevOps Engineer bij Mail.ru Cloud Solutions. Ik heb tientallen gebouwde infrastructuren en honderden geschreven CI/CD-pijplijnen. Gecertificeerde Kubernetes-beheerder. Auteur van diverse cursussen over Kubernetes en DevOps. Regelmatige spreker op Russische en internationale IT-conferenties.
Alles zal zwaar, onvoorspelbaar en in de praktijk zijn. Je gaat bouwen, afbreken en repareren - en soms in heel verschillende volgordes.
Bouwen: Je zult SLO-, SLI-, SLA-indicatoren moeten formuleren voor een site die uit verschillende microservices bestaat; de architectuur en infrastructuur ontwikkelen die hen zullen ondersteunen; de locatie monteren, testen en inzetten; monitoring en waarschuwingen instellen.
Pauze: Je houdt rekening met interne en externe factoren die de SLO verslechteren: ontwikkelaarsfouten, infrastructuurstoringen, toestroom van bezoekers, DoS-aanvallen. Leer de robuustheid, het foutenbudget, de testpraktijken, het interruptbeheer en de operationele werklast begrijpen.
Reparatie: Je wordt getraind om het werk van een team snel en effectief te organiseren om een ββongeval in de kortst mogelijke tijd te elimineren: betrek collega's, informeer belanghebbenden en stel prioriteiten.
Studie: Je kunt de aanpak van de site analyseren vanuit een SRE-oogpunt. Analyseer incidenten. Bepaal hoe u ze in de toekomst kunt vermijden: verbeter de monitoring, verander de architectuur, benaderingen van ontwikkeling en exploitatie, regelgeving. Automatiseer processen.
U kunt de voorwaarden van de SRE-cursus vinden en het volledige programma bestuderen op
De online intensive staat gepland voor december 2020. Voor degenen die vooraf betalen voor deelname, hebben we een korting voorbereid.
Bent u klaar voor intensieve training, niet-standaard taken en plotselinge ongelukken?
Het zal gewoon niet gebeuren. Er zal professionele groei plaatsvinden.
Bron: www.habr.com