La epopeya sobre los administradores de sistemas como una especie en peligro de extinción

Administradores de sistemas de todo el mundo, ¡felicidades por sus vacaciones profesionales!

No nos quedan administradores de sistemas (bueno, casi). Sin embargo, la leyenda sobre ellos aún está fresca. En honor a la festividad, hemos preparado esta epopeya. Pónganse cómodos, queridos lectores.

La epopeya sobre los administradores de sistemas como una especie en peligro de extinción

Érase una vez el mundo de Dodo IS estaba en llamas. Durante esa época oscura, la tarea principal de nuestros administradores de sistemas fue sobrevivir un día más y no llorar.

Hace mucho tiempo, los programadores escribían código poco y lentamente, y lo publicaban en producción solo una vez a la semana. Entonces surgieron problemas solo una vez cada siete días. Pero luego comenzaron a escribir más código y a publicarlo con más frecuencia, los problemas comenzaron a aumentar, a veces todo comenzó a desmoronarse y se volvió peor retroceder. Los administradores del sistema sufrieron, pero toleraron esta farsa.

Se sentaban en casa por las noches con ansiedad en sus almas. Y cada vez que sucedió “nunca sucedió, y aquí nuevamente el monitoreo envía una señal de ayuda: ¡Amigo, el mundo está en llamas!”. Luego, nuestros administradores de sistemas se pusieron sus impermeables rojos, pantalones cortos sobre calzas, se rizaron la frente y volaron para salvar el mundo Dodo.

Atención, una pequeña explicación. Nunca ha habido administradores de sistemas clásicos que mantengan el hardware en Dodo IS. Inmediatamente habíamos avanzado sobre las nubes de Azure.

Que hicieron:

  • si algo se rompía, lo hacían para que lo repararan;
  • servidores malabares a un nivel experto;
  • fueron responsables de la red virtual en Azure;
  • responsable de las cosas de bajo nivel, por ejemplo, las interacciones de los componentes (*susurros* en los que a veces no se topaban);
  • el servidor se vuelve a conectar;
  • y muchos otros salvajes.

La vida de un equipo de ingenieros de infraestructuras (como llamábamos a nuestros administradores de sistemas) consistía entonces en apagar incendios y romper constantemente bancos de pruebas. Vivieron y sufrieron, y luego decidieron pensar: ¿por qué es tan malo, o tal vez podemos hacerlo mejor? Por ejemplo, ¿no dividiremos a las personas en programadores y administradores de sistemas?

problema

mayo: hay un administrador de sistemas que tiene servidores en su área de responsabilidad, una red que lo conecta con otros servidores, programas a nivel de infraestructura (un servidor web que aloja una aplicación, un sistema de gestión de bases de datos, etc.). Y hay un programador cuya área de responsabilidad es trabajar código.

Y hay cosas que están en el cruce. ¿De quién es esta responsabilidad?

Por lo general, nuestros administradores de sistemas y programadores se reunían justo en este cruce y comenzaba:

“Amigos, nada funciona, probablemente debido a la infraestructura.
- Amigo, no, está en el código.

Un día, en este momento, comenzó a crecer una cerca entre ellos, a través de la cual arrojaban alegremente caca. La faena, como una caca, fue lanzada de un lado a otro de la valla. Al mismo tiempo, nadie estuvo cerca de resolver la situación. Triste carita sonriente.

Un rayo de sol atravesó el cielo encapotado cuando hace unos años en Google se les ocurrió la idea de no intercambiar tareas, sino hacer algo en común.

Pero, ¿y si describimos todo como un código?

En 2016, Google lanzó un libro llamado "Ingeniería de confiabilidad del sitio" sobre la transformación del rol de un administrador de sistemas: de un maestro de la magia a un enfoque de ingeniería formalizado en el uso de software y automatización. Ellos mismos atravesaron todas las espinas y obstáculos, se acostumbraron y decidieron compartirlo con el mundo. El libro es de dominio público. aquí.

El libro contiene verdades simples:

  • hacer todo como código es bueno;
  • utilizar un enfoque de ingeniería - bueno;
  • hacer un buen seguimiento es bueno;
  • También es bueno evitar que se libere un servicio si no tiene un registro y una supervisión claros.

Estas prácticas fueron leídas por nuestro Gleb (entropía), y allá vamos. ¡Implementar! Ahora estamos en una etapa de transición. El equipo de SRE está formado (hay 6 especialistas listos, 6 más se están incorporando) y están listos para cambiar el mundo, que consiste completamente en código, para mejor.

Creamos nuestra infraestructura de tal manera que permita a los desarrolladores administrar sus entornos y colaborar con SRE de forma totalmente independiente.

Wang en lugar de conclusiones

El administrador de sistemas es una profesión digna. Pero el conocimiento de la parte del sistema también requiere excelentes habilidades de ingeniería de software.

Los sistemas son cada vez más simples, y el conocimiento superúnico de la administración de servidores de hierro es cada vez menos demandado cada año. Las tecnologías en la nube están reemplazando la necesidad de este conocimiento.

Un buen administrador de sistemas en un futuro cercano deberá tener buenas habilidades de ingeniería de software. Aún mejor, debería tener buenas habilidades en esta área.

Nadie sabe cómo predecir el futuro antes de que suceda, pero creemos que, con el tiempo, habrá cada vez menos empresas que quieran incorporarse al personal interminablemente hinchado de administradores de sistemas. Aunque, por supuesto, los fans se quedarán. Pocos hoy en día montan a caballo, la mayoría usa carros, aunque hay amantes...

¡Feliz día del administrador de sistemas a todos, código para todos!

Fuente: habr.com

Añadir un comentario