Trenquem alguna cosa, oi? En cas contrari, construïm i construïm, reparem i reparem. Avorriment mortal.
Trenquem-lo perquè no ens passi res per això, no només serem lloats per aquesta desgràcia. I després ho tornarem a construir, tant que serà un ordre de magnitud millor, més tolerant a errors i més ràpid.
I el trencarem de nou.
Creus que es tracta d'una competició per utilitzar l'instrument més secret de tota la nostra cosmonàutica: el gran martell espacial rus?
No, això és un SRE intensiu en línia. Va passar que cada curs
Al desembre en farem un altre
Fem una petita retrospectiva. Recordeu com fa només uns anys que RH correria per veure qui podria contractar la majoria d'enginyers de DevOps a la seva empresa. El premi ha canviat. Ara, com el sistema de seguiment Pantsir-S1, inspeccionen l'espai circumdant i busquen enginyers SRE. Vaig parlar a l'article "
A l'intensiu en línia
Ponents del curs:
Ivan Kruglov. Enginyer de programari personal a Databricks. Té experiència en empreses empresarials en lliurament i processament de missatges distribuïts, BigData i web-stack, cerca, construcció d'un núvol intern, malla de serveis.
Pavel Selivanov. Enginyer sènior de DevOps a Mail.ru Cloud Solutions. Tinc desenes d'infraestructures construïdes i centenars de pipelines CI/CD escrits. Administrador certificat de Kubernetes. Autor de diversos cursos sobre Kubernetes i DevOps. Ponent habitual en conferències de TI russes i internacionals.
Tot serà dur, impredictible i a la pràctica. Construiràs, trencaràs i repararàs, i de vegades en seqüències molt diferents.
Construcció: Haureu de formular indicadors SLO, SLI, SLA per a un lloc format per diversos microserveis; desenvolupar l'arquitectura i la infraestructura que els donarà suport; muntar, provar i desplegar el lloc; configurar el seguiment i l'alerta.
Trencar: Tindràs en compte els factors interns i externs que deterioren el SLO: errors del desenvolupador, fallades d'infraestructura, afluència de visitants, atacs DoS. Apreneu a comprendre la robustesa, el pressupost d'errors, les pràctiques de prova, la gestió d'interrupcions i la càrrega de treball operativa.
Reparació: Estaràs format per organitzar de manera ràpida i eficaç el treball d'un equip per eliminar un accident en el menor temps possible: implicar els companys, avisar els grups d'interès, establir prioritats.
Estudiar: Podreu analitzar l'aproximació al lloc des d'un punt de vista SRE. Analitzar incidències. Determinar com evitar-los en el futur: millorar el seguiment, canviar l'arquitectura, enfocaments de desenvolupament i funcionament, normativa. Automatitzar processos.
Podeu consultar els termes del curs SRE, així com estudiar el programa complet a
L'intensiu en línia està previst per al desembre de 2020. Per a aquells que paguin la participació per avançat, hem preparat un descompte.
Estàs preparat per a un entrenament intens, tasques no estàndard i accidents sobtats?
Simplement no passarà. Hi haurà creixement professional.
Font: www.habr.com