Online SRE intensive: sisirain namin ang lahat hanggang sa lupa, pagkatapos ay ayusin namin ito, sisirain namin ito ng ilang beses pa, at pagkatapos ay itatayo namin itong muli

Let's break something, di ba? Kung hindi, tayo ay nagtatayo at nagtatayo, nagkukumpuni at nagkukumpuni. Mortal na pagkabagot.

I-break natin ito para walang mangyari sa atin para dito - hindi lang tayo pupurihin sa kahihiyan na ito. At pagkatapos ay bubuuin natin muli ang lahat - nang sa gayon ay magiging mas mahusay, mas mapagparaya at mas mabilis ang mga ito.

At muli natin itong sisirain.

Sa tingin mo ba ito ay isang kumpetisyon upang gamitin ang pinakalihim na instrumento ng ating buong kosmonautika - ang Big Russian Space Hammer?

Hindi, ito ay isang online na SRE intensive. Nagkataon lang na bawat kurso Slurm SRE hindi at hindi kailanman tulad ng nauna. Dahil hindi mo nahuhulaan na sa isang napakalaking kumplikadong sistema, kung saan libu-libo at libu-libong user ang kumokonekta bawat segundo, at ang audience mismo ay ilang milyon, maaari itong mahulog, masira, maging mapurol, glitch, at sa daan-daang iba pang paraan ay masira. ang mood ng duty shift ng SRE engineers.

Sa December isa pa ang gagawin namin SRE intensive.

Online SRE intensive: sisirain namin ang lahat hanggang sa lupa, pagkatapos ay ayusin namin ito, sisirain namin ito ng ilang beses pa, at pagkatapos ay itatayo namin itong muli

Gumawa tayo ng kaunting retrospective. Alalahanin kung paano ilang taon na ang nakalilipas ang HR ay makikipagkarera upang makita kung sino ang maaaring kumuha ng pinakamaraming DevOps engineer sa kanilang kumpanya. Ang premyo ay nagbago. Ngayon, tulad ng Pantsir-S1 tracking system, sinisiyasat nila ang nakapalibot na espasyo at naghahanap ng mga inhinyero ng SRE. Nakipag-usap ako sa artikulo "Evgeniy Varavva, developer sa Google. Paano ilarawan ang Google sa 5 salitaβ€œAno ang buhay para sa isang inhinyero ng SRE sa Google, at kung paano kahit na ang naturang korporasyon ay nakakaranas ng kakulangan ng mga espesyalista sa SRE.

Sa online intensive Slurm SRE sa Disyembre, sa loob ng tatlong araw, mula 10:00 hanggang 19:00, matututunan mo kung paano masigurado ang bilis, fault tolerance at availability ng mga website sa mga kondisyon ng limitadong mapagkukunan, alisin ang mga insidente sa IT at magsagawa ng debriefing upang hindi na maulit ang mga problema.

Mga tagapagsalita ng kurso:

Ivan Kruglov. Staff Software Engineer sa Databricks. May karanasan sa mga kumpanya ng enterprise sa distributed message delivery at processing, BigData at web-stack, paghahanap, pagbuo ng internal cloud, service mesh.

Pavel Selivanov. Senior DevOps Engineer sa Mail.ru Cloud Solutions. Mayroon akong dose-dosenang mga binuo na imprastraktura at daan-daang nakasulat na CI/CD pipelines. Certified Kubernetes Administrator. May-akda ng ilang kurso sa Kubernetes at DevOps. Regular na tagapagsalita sa Russian at internasyonal na mga kumperensya ng IT.

Ang lahat ay magiging matigas, hindi mahuhulaan at sa pagsasanay. Ikaw ay bubuo, masisira at aayusin - at kung minsan sa iba't ibang mga pagkakasunud-sunod.

Build: Kailangan mong bumalangkas ng mga tagapagpahiwatig ng SLO, SLI, SLA para sa isang site na binubuo ng ilang mga microservice; bumuo ng arkitektura at imprastraktura na susuporta sa kanila; tipunin, subukan at i-deploy ang site; i-set up ang pagsubaybay at pag-alerto.

Pahinga: Isasaalang-alang mo ang panloob at panlabas na mga salik na nagpapalala sa SLO: mga error ng developer, mga pagkabigo sa imprastraktura, pagdagsa ng mga bisita, pag-atake ng DoS. Matuto upang maunawaan ang katatagan, badyet ng error, mga kasanayan sa pagsubok, pag-abala sa pamamahala at pagpapatakbo ng workload.

Pagkukumpuni: Sasanayin ka upang mabilis at epektibong ayusin ang gawain ng isang pangkat upang maalis ang isang aksidente sa pinakamaikling posibleng panahon: isali ang mga kasamahan, abisuhan ang mga stakeholder, at magtakda ng mga priyoridad.

Pag-aaral: Magagawa mong suriin ang diskarte sa site mula sa isang SRE point of view. Pag-aralan ang mga pangyayari. Tukuyin kung paano maiiwasan ang mga ito sa hinaharap: pagbutihin ang pagsubaybay, baguhin ang arkitektura, diskarte sa pag-unlad at operasyon, mga regulasyon. I-automate ang mga proseso.

Online SRE Intensive ginagaya ang mga tunay na kundisyon - ang oras upang maibalik ang serbisyo ay magiging lubhang limitado. Parang sa totoong buhay, parang sa totoong trabaho.

Maaari mong malaman ang mga tuntunin ng kursong SRE, pati na rin pag-aralan ang buong programa sa link.

Ang online intensive ay binalak para sa Disyembre 2020. Para sa mga nagbabayad para sa paglahok nang maaga, naghanda kami ng isang diskwento.

Handa ka na ba para sa matinding pagsasanay, hindi karaniwang mga gawain at biglaang aksidente?

Hindi lang mangyayari. Magkakaroon ng propesyonal na paglago.

Pinagmulan: www.habr.com

Magdagdag ng komento