Epos o správcoch systému ako o ohrozenom druhu

Správcovia systému na celom svete, blahoželáme vám k profesionálnej dovolenke!

Nezostali nám žiadni správcovia systému (skoro). Legenda o nich je však stále čerstvá. Na počesť sviatku sme pripravili tento epos. Urobte si pohodlie, milí čitatelia.

Epos o správcoch systému ako o ohrozenom druhu

Kedysi bol svet Dodo IS v plameňoch. V tomto temnom období bolo hlavnou úlohou našich systémových administrátorov prežiť ešte jeden deň a nezaplakať.

Dávno programátori písali kód málo a pomaly a posielali ho na prod len raz za týždeň. Problémy teda vznikali len raz za sedem dní. Potom však začali písať viac kódu a uverejňovať ho častejšie, problémy začali pribúdať, niekedy sa všetko začalo rúcať a bolo horšie vrátiť sa späť. Správcovia systému trpeli, ale túto frašku tolerovali.

S úzkosťou v duši sedeli po večeroch doma. A zakaždým, keď sa to stalo „nikdy sa to nestalo, a tu opäť monitorovanie vysiela signál o pomoc: Kámo, svet je v plameňoch!“. Potom si naši správcovia systému obliekli červené pršiplášte, šortky cez legíny, urobili si kučery na čele a leteli zachrániť svet Dodo.

Pozor, malé vysvetlenie. Nikdy neexistovali klasickí systémoví administrátori, ktorí by spravovali hardvér v Dodo IS. Okamžite sme pokročili v oblakoch Azure.

Čo urobili:

  • ak sa niečo pokazilo, urobili to tak, že sa to opravilo;
  • žonglované servery na expertnej úrovni;
  • boli zodpovední za virtuálnu sieť v Azure;
  • zodpovedný za veci nízkej úrovne, napríklad interakcie komponentov (*šepkanie*, v ktorom niekedy netápali);
  • server sa znova pripojí;
  • a mnoho ďalších divokých.

Život tímu infraštruktúrnych inžinierov (ako sme nazývali našich systémových administrátorov) potom pozostával z hasenia požiarov a neustáleho rozbíjania testovacích lavíc. Žili a smútili, a potom sa rozhodli premýšľať: prečo je to také zlé, alebo možno môžeme urobiť lepšie? Nerozdelíme ľudí napríklad na programátorov a systémových administrátorov?

problém

Vzhľadom na to: existuje správca systému, ktorý má vo svojej oblasti zodpovednosti servery, sieť, ktorá ho spája s inými servermi, programy na úrovni infraštruktúry (webový server, ktorý je hostiteľom aplikácie, systém správy databáz atď.). A existuje programátor, ktorého oblasťou zodpovednosti je pracovný kód.

A sú veci, ktoré sú na križovatke. Čia je to zodpovednosť?

Zvyčajne sa naši systémoví administrátori a programátori stretli práve na tejto križovatke a začalo to:

„Chlapi, nič nefunguje, pravdepodobne kvôli infraštruktúre.
- Kámo, nie, je to v kóde.

Jedného dňa v tejto chvíli medzi nimi začal rásť plot, cez ktorý radostne hádzali hovienka. Úloha sa ako hovienka prehadzovala z jednej strany plota na druhú. Zároveň sa nikto nepriblížil k vyriešeniu situácie. Smutný smajlík.

Slnečný lúč prepichol zatiahnutú oblohu, keď pred pár rokmi v Google prišli s nápadom nevymieňať si úlohy, ale robiť spoločnú vec.

Čo ak však všetko popíšeme ako kód?

V roku 2016 spoločnosť Google vydala knihu s názvom „Site Reliability Engineering“ o transformácii úlohy správcu systému: z majstra mágie na formalizovaný inžiniersky prístup pri používaní softvéru a automatizácie. Sami prešli všetkými tŕňmi a prekážkami, prišli na to a rozhodli sa podeliť so svetom. Kniha je vo verejnej doméne tu.

Kniha obsahuje jednoduché pravdy:

  • robiť všetko ako kód je dobré;
  • použiť inžiniersky prístup - dobrý;
  • robiť dobré monitorovanie je dobré;
  • zabránenie uvoľneniu služby, ak nemá jasné protokolovanie a monitorovanie, je tiež dobré.

Tieto praktiky prečítal náš Gleb (entropia) a ideme preč. Implementácia! Teraz sme v prechodnom štádiu. Tím SRE je vytvorený (je tu 6 hotových špecialistov, 6 ďalších je onboarding) a je pripravený zmeniť svet, ktorý pozostáva výlučne z kódu, k lepšiemu.

Našu infraštruktúru vytvárame tak, aby sme vývojárom umožnili spravovať svoje prostredia a spolupracovať so SRE úplne nezávisle.

Wang namiesto záverov

Systémový administrátor je dôstojná profesia. Znalosť systémovej časti si však vyžaduje aj vynikajúce schopnosti softvérového inžinierstva.

Systémy sú čoraz jednoduchšie a super unikátne znalosti o správe železných serverov sú každým rokom menej žiadané. Cloudové technológie nahrádzajú potrebu týchto znalostí.

Dobrý správca systému v blízkej budúcnosti bude musieť mať dobré zručnosti v oblasti softvérového inžinierstva. Ešte lepšie je, že by mal mať v tejto oblasti dobré zručnosti.

Nikto nevie predpovedať budúcnosť skôr, ako sa tak stane, no veríme, že v priebehu času bude čoraz menej spoločností, ktoré sa budú chcieť pridať k nekonečne nabubrenému personálu systémových administrátorov. Aj keď, samozrejme, fanúšikovia zostanú. Málokto dnes jazdí na koňoch, väčšinou používa autá, aj keď existujú milenci ...

Šťastný deň správcu systému všetkým, kód pre všetkých!

Zdroj: hab.com

Pridať komentár