L'èpica sobre els administradors de sistemes com a espècie en perill d'extinció

Administradors de sistemes de tot el món, enhorabona per les vostres vacances professionals!

No ens queden administradors del sistema (bé, gairebé). Tanmateix, la llegenda sobre ells encara és fresca. En honor a les festes, hem preparat aquesta èpica. Poseu-vos còmodes, estimats lectors.

L'èpica sobre els administradors de sistemes com a espècie en perill d'extinció

Hi havia una vegada el món de Dodo IS ardeva. Durant aquell temps fosc, la tasca principal dels nostres administradors del sistema era sobreviure un altre dia i no plorar.

Hi havia una vegada, els programadors escrivien codi poc i lentament, i el publicaven només un cop per setmana. Per tant, els problemes només sorgien un cop cada set dies. Però aleshores van començar a escriure més codi i a publicar-lo amb més freqüència, els problemes van començar a augmentar, de vegades tot va començar a ensorrar-se i els retrocessos van empitjorar. Els administradors del sistema van patir, però van tolerar aquesta farsa.

S'asseien a casa al vespre amb ansietat a l'ànima. I cada vegada que va passar "no va passar mai, i ara de nou el monitoratge envia un senyal d'ajuda: Amic, el món està en flames!" Aleshores, els administradors del nostre sistema es van posar els impermeables vermells, els pantalons curts sobre les polaines, es van fer un rínxol al front i van volar per salvar el món Dodo.

Atenció, una petita explicació. Mai hi ha hagut administradors de sistemes clàssics que mantenen el maquinari a Dodo IS. De seguida vam avançar als núvols Azure.

Que van fer:

  • si es trencava alguna cosa, s'asseguraven que estava arreglat;
  • servidors malabars a nivell expert;
  • van ser els responsables de la xarxa virtual a Azure;
  • eren els responsables de coses de baix nivell, per exemple, les interaccions dels components (*xiuxiueigs* que de vegades no s'enfonsaven);
  • reconnexions de servidors;
  • i molts altres de salvatges.

La vida d'un equip d'enginyers d'infraestructures (així anomenàvem els nostres administradors de sistemes) va consistir llavors a apagar focs i trencar constantment bancs de proves. Van viure i es van dol, i després van decidir pensar: per què és tan dolent, o potser ho podem fer millor? Per exemple, no dividim la gent en programadors i administradors de sistemes?

Problema

Donat: hi ha un administrador del sistema que s'encarrega dels servidors, una xarxa que el connecta amb altres servidors, programes a nivell d'infraestructura (servidor web que allotja l'aplicació, sistema de gestió de bases de dades, etc.). I hi ha un programador l'àrea de responsabilitat del qual és el codi de treball.

I hi ha coses que estan a la cruïlla. De qui és aquesta responsabilitat?

Normalment va ser en aquesta cruïlla on es reunien els nostres administradors de sistemes i programadors i va començar:

- Amics, no funciona res, probablement per la infraestructura.
- Amics, no, està al codi.

Un dia, en aquest moment, va començar a créixer entre ells una tanca, a través de la qual amb alegria van llençar caca. El problema va ser llençat d'un costat a l'altre de la tanca, com una torda. Tanmateix, ningú va estar a prop de resoldre la situació. Somriure trist.

Un raig de sol va travessar el cel ennuvolat quan fa uns anys a Google se li va ocórrer la idea de no compartir tasques, sinó de fer coses comunes.

Què passaria si ho descriguéssim tot com a codi?

El 2016, Google va publicar el llibre "Site Reliability Engineering" sobre la transformació del paper de l'administrador del sistema: d'un mestre de màgia a un enfocament d'enginyeria formalitzat per utilitzar programari i automatització. Ells mateixos van passar per totes les espines i els obstacles, s'hi van agafar i van decidir compartir-ho amb el món. El llibre és de domini públic aquí.

El llibre conté veritats senzilles:

  • fer-ho tot com a codi és bo;
  • utilitzar un enfocament d'enginyeria és bo;
  • fer un bon seguiment és bo;
  • no permetre que s'alliberi un servei si no té un registre i un seguiment clars també és bo.

Aquestes pràctiques van ser llegides pel nostre Gleb (entropia), i anem. Implementem-ho! Ara estem en una etapa de transició. L'equip SRE s'ha format (hi ha 6 especialistes preparats, altres 6 estan en procés d'incorporació) i està preparat per canviar el món, que està format íntegrament en codi, per a millor.

Estem creant la nostra infraestructura de manera que permeti als desenvolupadors gestionar els seus entorns de manera totalment independent i col·laborar amb SRE.

Wanguy en comptes de conclusions

L'administrador de sistemes és una professió digna. Però el coneixement de la part del sistema també requereix excel·lents habilitats d'enginyeria de programari.

Els sistemes són cada cop més senzills i el coneixement únic sobre l'administració de servidors de maquinari és cada vegada menys demandat cada any. Les tecnologies al núvol estan substituint la necessitat d'aquest coneixement.

Un bon administrador de sistemes en un futur proper haurà de tenir bones habilitats en enginyeria de programari. I encara és millor que tingui bones habilitats en aquest àmbit.

Ningú sap com predir el futur abans que passi, però creiem que amb el pas del temps seran cada cop menys les empreses que estaran disposades a augmentar la seva plantilla d'administradors de sistemes, en constant creixement. Encara que, és clar, hi haurà aficionats. Poca gent avui fa servir cotxes, encara que n'hi ha que són aficionats...

Feliç dia de l'administrador del sistema a tothom, codi per a tothom!

Font: www.habr.com

Afegeix comentari