Hai să spargem ceva, da? Altfel construim și construim, reparam și reparam. Plictiseala de moarte.
Să-l rupem ca să nu ni se întâmple nimic pentru ea - nu numai că vom fi lăudați pentru această rușine. Și apoi vom construi totul din nou - atât de mult încât va fi cu un ordin de mărime mai bun, mai tolerant la erori și mai rapid.
Și o vom sparge din nou.
Crezi că aceasta este o competiție pentru a folosi cel mai secret instrument din întreaga noastră cosmonautică - Marele ciocan spațial rusesc?
Nu, acesta este un SRE intensiv online. S-a întâmplat ca fiecare curs
În decembrie vom ține altul
Să facem o mică retrospectivă. Amintiți-vă cum în urmă cu doar câțiva ani HR s-a curs pentru a vedea cine ar putea angaja cei mai mulți ingineri DevOps în compania lor. Premiul s-a schimbat. Acum, ca și sistemul de urmărire Pantsir-S1, ei inspectează spațiul înconjurător și caută ingineri SRE. Am vorbit în articol „
La intensiv online
Vorbitori de curs:
Ivan Kruglov. Staff Software Engineer la Databricks. Are experiență în companii de întreprindere în livrarea și procesarea mesajelor distribuite, BigData și web-stack, căutare, construirea unui cloud intern, rețea de servicii.
Pavel Selivanov. Senior DevOps Engineer la Mail.ru Cloud Solutions. Am zeci de infrastructuri construite și sute de conducte CI/CD scrise. Administrator certificat Kubernetes. Autor al mai multor cursuri despre Kubernetes și DevOps. Vorbitor regulat la conferințe IT ruse și internaționale.
Totul va fi dur, imprevizibil și în practică. Veți construi, sparge și repara - și uneori în secvențe foarte diferite.
Construi: Va trebui să formulați indicatori SLO, SLI, SLA pentru un site format din mai multe microservicii; să dezvolte arhitectura și infrastructura care le va sprijini; asamblarea, testarea și implementarea site-ului; configurați monitorizarea și alertarea.
Pauză: Veți lua în considerare factorii interni și externi care deteriorează SLO: erori ale dezvoltatorului, defecțiuni ale infrastructurii, aflux de vizitatori, atacuri DoS. Învățați să înțelegeți robustețea, bugetul de erori, practicile de testare, managementul întreruperilor și volumul de lucru operațional.
Reparație: Veți fi instruit pentru a organiza rapid și eficient munca unei echipe pentru a elimina un accident în cel mai scurt timp posibil: implicați colegii, notificați părțile interesate și stabiliți prioritățile.
Studiu: Vei putea analiza abordarea site-ului din punct de vedere SRE. Analizați incidentele. Determinați cum să le evitați în viitor: îmbunătățiți monitorizarea, schimbați arhitectura, abordările de dezvoltare și operare, reglementări. Automatizați procesele.
Puteți afla termenii cursului SRE, precum și studiul programului complet la
Intensiva online este planificată pentru decembrie 2020. Pentru cei care plătesc pentru participare în avans, am pregătit o reducere.
Ești pregătit pentru antrenament intens, sarcini non-standard și accidente bruște?
Doar că nu se va întâmpla. Va exista o creștere profesională.
Sursa: www.habr.com