Epopeea despre administratorii de sistem ca specie pe cale de dispariție

Administratori de sistem din întreaga lume, felicitări pentru vacanța profesională!

Nu mai avem administratori de sistem (bine, aproape). Cu toate acestea, legenda despre ei este încă proaspătă. În cinstea sărbătorii, am pregătit această epopee. Fiți confortabil, dragi cititori.

Epopeea despre administratorii de sistem ca specie pe cale de dispariție

Odată, lumea lui Dodo IS ardea. În acea perioadă întunecată, principala sarcină a administratorilor noștri de sistem a fost să supraviețuiască încă o zi și să nu plângă.

Cu mult timp în urmă, programatorii scriau cod puțin și încet și îl postau pe prod doar o dată pe săptămână. Deci problemele au apărut doar o dată la șapte zile. Dar apoi au început să scrie mai mult cod și să-l posteze mai des, problemele au început să crească, uneori totul a început să se destrame și a devenit mai rău să se retragă. Administratorii de sistem au suferit, dar au tolerat această farsă.

Stăteau acasă seara cu neliniște în suflet. Și de fiecare dată când s-a întâmplat „nu s-a întâmplat niciodată, iar aici monitorizarea trimite un semnal de ajutor: Omule, lumea e în flăcări!”. Apoi, administratorii noștri de sistem și-au îmbrăcat hainele de ploaie roșii, pantalonii scurți peste jambiere, și-au făcut o buclă pe frunte și au zburat pentru a salva lumea Dodo.

Atentie, o mica explicatie. Nu au existat niciodată administratori de sistem clasici care să întrețină hardware-ul în Dodo IS. Am avansat imediat pe norii Azure.

Ce au facut:

  • dacă s-a stricat ceva, au făcut ca să fie reparat;
  • servere jonglate la nivel de expert;
  • au fost responsabili pentru rețeaua virtuală în Azure;
  • au fost responsabili pentru lucruri de nivel scăzut, de exemplu, interacțiunile componentelor (*șoaptă* în care uneori nu scotoceau);
  • reconectarea serverului;
  • și multe altele sălbatice.

Viața unei echipe de ingineri de infrastructură (cum numiam noi administratori de sistem) a constat apoi în stingerea incendiilor și spargerea constantă a bancurilor de testare. Au trăit și s-au întristat, apoi au decis să se gândească: de ce este atât de rău, sau poate putem face mai bine? De exemplu, nu vom împărți oamenii în programatori și administratori de sistem?

problemă

Dat: există un administrator de sistem care are servere în zona sa de responsabilitate, o rețea care îl conectează la alte servere, programe la nivel de infrastructură (un server web care găzduiește o aplicație, un sistem de gestionare a bazelor de date etc.). Și există un programator a cărui zonă de responsabilitate este codul de lucru.

Și sunt lucruri care sunt la intersecție. A cui este aceasta responsabilitate?

De obicei, administratorii și programatorii noștri de sistem s-au întâlnit doar la această intersecție și a început:

„Băieți, nimic nu funcționează, probabil din cauza infrastructurii.
- Omule, nu, este în cod.

Într-o zi în acest moment, între ei a început să crească un gard prin care aruncau cu bucurie caca. Sarcina, ca o caca, a fost aruncată de la o parte la alta a gardului. În același timp, nimeni nu s-a apropiat de rezolvarea situației. Zâmbet trist.

O rază de soare a străpuns cerul înnorat când în urmă cu câțiva ani la Google au venit cu ideea să nu facă schimb de sarcini, ci în schimb să facă un lucru comun.

Dar dacă descriem totul ca pe un cod?

În 2016, Google a lansat o carte numită „Site Reliability Engineering” despre transformarea rolului unui administrator de sistem: de la un maestru al magiei la o abordare inginerească oficializată în utilizarea software-ului și a automatizării. Ei înșiși au trecut prin toate spinii și obstacolele, s-au înțeles și au decis să-l împărtășească lumii. Cartea este în domeniul public aici.

Cartea conține adevăruri simple:

  • a face totul ca cod este bine;
  • utilizați o abordare inginerească - bine;
  • a face o monitorizare bună este bine;
  • prevenirea lansării unui serviciu dacă nu are înregistrare clară și monitorizare este de asemenea bună.

Aceste practici au fost citite de către Gleb al nostru (entropie), și plecăm. Implementare! Acum suntem într-o etapă de tranziție. Echipa SRE este formată (sunt 6 specialiști gata pregătiți, încă 6 se integrează) și sunt gata să schimbe lumea, constând în întregime din cod, în bine.

Ne creăm infrastructura astfel încât să le permitem dezvoltatorilor să-și gestioneze mediile și să colaboreze cu SRE complet pe cont propriu.

Wang în loc de concluzii

Administratorul de sistem este o profesie demnă. Dar cunoașterea părții de sistem necesită, de asemenea, abilități excelente de inginerie software.

Sistemele devin din ce în ce mai simple, iar cunoștințele super unice despre administrarea serverelor de fier devin din ce în ce mai puțin solicitate în fiecare an. Tehnologiile cloud înlocuiesc necesitatea acestor cunoștințe.

Un administrator de sistem bun în viitorul apropiat va trebui să aibă abilități bune de inginerie software. Și mai bine, ar trebui să aibă abilități bune în acest domeniu.

Nimeni nu știe cum să prezică viitorul înainte ca acesta să se întâmple, dar credem că în timp vor fi din ce în ce mai puține companii care vor să adauge personalului nesfârșit umflat al administratorilor de sistem. Deși, desigur, fanii vor rămâne. Puțini călări astăzi pe cai, folosesc în mare parte mașini, deși există iubitori...

La mulți ani de administrare de sistem tuturor, cod pentru toată lumea!

Sursa: www.habr.com

Adauga un comentariu