Epos o správcích systému jako ohroženém druhu

Správci systému z celého světa, gratulujeme k vaší profesionální dovolené!

Nezůstali nám žádní správci systému (tedy skoro). Legenda o nich je však stále čerstvá. Na počest svátku jsme připravili tento epos. Udělejte si pohodlí, milí čtenáři.

Epos o správcích systému jako ohroženém druhu

Kdysi byl svět Dodo IS v plamenech. Během té temné doby bylo hlavním úkolem našich systémových administrátorů přežít další den a nebrečet.

Kdysi programátoři psali kód málo a pomalu a publikovali ho jen jednou týdně. Problémy tedy vznikaly jen jednou za sedm dní. Pak ale začali psát další kód a publikovat ho častěji, problémů začalo přibývat, někdy se všechno začalo rozpadat a rollbacky se zhoršily. Správci systému trpěli, ale tuto frašku tolerovali.

Seděli po večerech doma s úzkostí v duši. A pokaždé, když se to stalo, "nikdy se to nestalo, a teď opět monitorování vysílá signál o pomoc: Ty vole, svět hoří!" Pak si naši správci systému oblékli červené pláštěnky, kraťasy přes legíny, udělali si loknu na čele a letěli zachránit svět Dodo.

Pozor, malé vysvětlení. Nikdy tu nebyli klasičtí správci systému, kteří udržují hardware v Dodo IS. Okamžitě jsme pokročili v oblacích Azure.

Co dělali:

  • pokud se něco rozbilo, ujistili se, že je to opraveno;
  • žonglované servery na expertní úrovni;
  • byli zodpovědní za virtuální síť v Azure;
  • byli zodpovědní za věci nízké úrovně, například interakce komponent (*šeptání*, o kterých někdy netápali);
  • opětovné připojení serveru;
  • a mnoho dalších divokých.

Život týmu infrastrukturních inženýrů (tak jsme nazývali naše systémové administrátory) pak spočíval v hašení požárů a neustálém rozbíjení zkušebních stolic. Žili a truchlili a pak se rozhodli přemýšlet: proč je to tak špatné, nebo to možná můžeme udělat lépe? Nerozdělujme například lidi na programátory a systémové administrátory?

Problém

Vzhledem k: existuje správce systému, který je odpovědný za servery, síť, která jej připojuje k jiným serverům, programy na úrovni infrastruktury (webový server, který je hostitelem aplikace, systém správy databází atd.). A existuje programátor, jehož oblastí odpovědnosti je pracovní kód.

A jsou věci, které jsou na křižovatce. Čí je to odpovědnost?

Obvykle to bylo na tomto místě, kde se setkali naši systémoví administrátoři a programátoři a začalo:

- Kluci, nic nefunguje, pravděpodobně kvůli infrastruktuře.
- Kluci, ne, je to v kódu.

Jednoho dne v tuto chvíli mezi nimi začal růst plot, přes který radostně házeli hovínka. Problém se házel z jedné strany plotu na druhou jako hovno. K vyřešení situace se však nikdo nepřiblížil. Smutný smajlík.

Sluneční paprsek prorazil zataženou oblohu, když před pár lety Google přišel s nápadem nesdílet úkoly, ale dělat společné věci.

Co kdybychom vše popsali jako kód?

V roce 2016 Google vydal knihu „Site Reliability Engineering“ o transformaci role správce systému: z mistra magie na formalizovaný inženýrský přístup k používání softwaru a automatizace. Sami prošli všemi trny a překážkami, dostali se na kloub a rozhodli se podělit se o to se světem. Kniha je ve veřejném vlastnictví zde.

Kniha obsahuje jednoduché pravdy:

  • dělat vše jako kód je dobré;
  • použití inženýrského přístupu je dobré;
  • dělat dobré monitorování je dobré;
  • neumožnit uvolnění služby, pokud nemá jasné protokolování a monitorování, je také dobré.

Tyto praktiky četl náš Gleb (entropie), a jedeme. Pojďme to implementovat! Nyní jsme v přechodné fázi. Tým SRE byl vytvořen (je zde 6 hotových specialistů, dalších 6 prochází onboardingem) a je připraven změnit svět, který se skládá výhradně z kódu, k lepšímu.

Naši infrastrukturu vytváříme tak, abychom vývojářům umožnili spravovat svá prostředí zcela nezávisle a spolupracovat s SRE.

Wanguy místo závěrů

Správce systému je důstojná profese. Ale znalost systémové části také vyžaduje vynikající dovednosti softwarového inženýrství.

Systémy jsou stále jednodušší a superjedinečné znalosti správy hardwarových serverů jsou každým rokem méně žádané. Potřebu těchto znalostí nahrazují cloudové technologie.

Dobrý správce systému v blízké budoucnosti bude muset mít dobré dovednosti softwarového inženýrství. A ještě lepší je, že má v této oblasti dobré dovednosti.

Nikdo neví, jak předvídat budoucnost dříve, než k ní dojde, ale věříme, že v průběhu času bude stále méně společností, které budou ochotny navyšovat svůj nekonečně balonový personál systémových administrátorů. I když se samozřejmě najdou amatéři. Na koních dnes jezdí málokdo, většinou jezdí auty, i když jsou mezi nimi i amatéři...

Šťastný systémový den všem, kód všem!

Zdroj: www.habr.com

Přidat komentář