La oss bryte noe, skal vi? Ellers bygger vi og bygger, reparerer og reparerer. Dødelig kjedsomhet.
La oss bryte det slik at det ikke skjer noe med oss for det – ikke bare vil vi få ros for denne vanæret. Og så bygger vi alt på nytt - så mye at det blir en størrelsesorden bedre, mer feiltolerant og raskere.
Og vi bryter den igjen.
Tror du dette er en konkurranse om å bruke det mest hemmelige instrumentet i hele vår kosmonautikk - den store russiske romhammeren?
Nei, dette er en online SRE-intensiv. Det hendte bare at hvert kurs
I desember holder vi en til
La oss gjøre et lite tilbakeblikk. Husk hvordan HR for bare noen få år siden løp for å se hvem som kunne ansette flest DevOps-ingeniører i selskapet deres. Premien har endret seg. Nå, som Pantsir-S1-sporingssystemet, inspiserer de det omkringliggende rommet og ser etter SRE-ingeniører. Jeg snakket i artikkelen "
På nettintensiven
Kursholdere:
Ivan Kruglov. Staff Software Engineer hos Databricks. Har erfaring i bedriftsbedrifter innen distribuert meldingslevering og -behandling, BigData og web-stack, søk, bygging av intern sky, service mesh.
Pavel Selivanov. Senior DevOps-ingeniør hos Mail.ru Cloud Solutions. Jeg har dusinvis av bygde infrastrukturer og hundrevis av skrevne CI/CD-rørledninger. Sertifisert Kubernetes-administrator. Forfatter av flere kurs om Kubernetes og DevOps. Fast foredragsholder på russiske og internasjonale IT-konferanser.
Alt blir tøft, uforutsigbart og i praksis. Du skal bygge, bryte og reparere – og noen ganger i svært forskjellige sekvenser.
Bygge: Du må formulere SLO, SLI, SLA-indikatorer for et nettsted som består av flere mikrotjenester; utvikle arkitekturen og infrastrukturen som vil støtte dem; sette sammen, teste og distribuere nettstedet; sette opp overvåking og varsling.
Gå i stykker: Du vil vurdere interne og eksterne faktorer som forverrer SLO: utviklerfeil, infrastrukturfeil, tilstrømning av besøkende, DoS-angrep. Lær å forstå robusthet, feilbudsjett, testpraksis, avbruddsadministrasjon og operasjonell arbeidsbelastning.
Reparere: Du vil bli opplært til å raskt og effektivt organisere arbeidet til et team for å eliminere en ulykke på kortest mulig tid: involvere kolleger, varsle interessenter og angi prioriteringer.
Studere: Du vil kunne analysere tilnærmingen til nettstedet fra et SRE-synspunkt. Analyser hendelser. Bestem hvordan du unngår dem i fremtiden: forbedre overvåkingen, endre arkitekturen, tilnærminger til utvikling og drift, forskrifter. Automatiser prosesser.
Du kan finne ut vilkårene for SRE-kurset, samt studere hele programmet på
Nettintensiven er planlagt til desember 2020. For de som betaler for deltakelse på forhånd har vi utarbeidet rabatt.
Er du klar for intens trening, ikke-standardiserte oppgaver og plutselige ulykker?
Det vil bare ikke skje. Det blir faglig vekst.
Kilde: www.habr.com