L'épopée sur les administrateurs système en tant qu'espèce en voie de disparition

Administrateurs système du monde entier, félicitations pour vos vacances professionnelles !

Nous n'avons plus d'administrateur système (enfin, presque). Cependant, la légende à leur sujet est encore fraîche. En l'honneur de la fête, nous avons préparé cette épopée. Installez-vous confortablement, chers lecteurs.

L'épopée sur les administrateurs système en tant qu'espèce en voie de disparition

Il était une fois le monde de Dodo IS en feu. Pendant cette période sombre, la tâche principale de nos administrateurs système était de survivre un jour de plus et de ne pas pleurer.

Il y a longtemps, les programmeurs écrivaient le code peu et lentement et ne le publiaient sur prod qu'une fois par semaine. Les problèmes ne survenaient donc qu’une fois tous les sept jours. Mais ensuite, ils ont commencé à écrire plus de code et à le publier plus souvent, les problèmes ont commencé à augmenter, parfois tout a commencé à s'effondrer et il est devenu pire de revenir en arrière. Les administrateurs système ont souffert, mais ont toléré cette farce.

Ils restaient à la maison le soir avec de l'anxiété dans l'âme. Et à chaque fois que cela s'est produit, «cela n'est jamais arrivé, et là encore, la surveillance envoie un signal à l'aide : Mec, le monde est en feu !». Ensuite, nos administrateurs système ont enfilé leurs imperméables rouges, leurs shorts par-dessus leurs leggings, se sont courbés le front et se sont envolés pour sauver le monde Dodo.

Attention, une petite explication. Il n'y a jamais eu d'administrateur système classique qui assure la maintenance du matériel dans Dodo IS. Nous avons tout de suite avancé sur les cloud Azure.

Qu'ont-ils fait:

  • si quelque chose se cassait, ils faisaient en sorte que ce soit réparé ;
  • jonglé avec des serveurs à un niveau expert ;
  • étaient responsables du réseau virtuel dans Azure ;
  • étaient responsables de choses de bas niveau, par exemple les interactions des composants (*chuchotant* dans lesquels parfois ils ne fouillaient pas) ;
  • le serveur se reconnecte ;
  • et bien d'autres sauvages.

La vie d’une équipe d’ingénieurs en infrastructures (comme nous appelions nos administrateurs système) consistait alors à éteindre les incendies et à casser sans cesse les bancs de tests. Ils ont vécu et pleuré, puis ils ont décidé de réfléchir : pourquoi est-ce si grave, ou peut-être pouvons-nous faire mieux ? Par exemple, ne diviserons-nous pas les gens en programmeurs et administrateurs système ?

problème

donné: il y a un administrateur système qui a des serveurs dans sa zone de responsabilité, un réseau qui le connecte à d'autres serveurs, des programmes au niveau de l'infrastructure (un serveur web qui héberge une application, un système de gestion de base de données, etc.). Et il y a un programmeur dont le domaine de responsabilité est le code de travail.

Et il y a des choses qui sont à la croisée des chemins. À qui revient cette responsabilité ?

Habituellement, nos administrateurs système et nos programmeurs se rencontraient juste à ce moment-là et cela commençait :

« Les mecs, rien ne fonctionne, probablement à cause de l'infrastructure.
- Mec, non, c'est dans le code.

Un jour, à ce moment-là, une clôture commença à se développer entre eux, à travers laquelle ils jetèrent joyeusement du caca. La tâche, comme une crotte, a été jetée d’un côté à l’autre de la clôture. Dans le même temps, personne n’a réussi à résoudre la situation. Triste smiley.

Un rayon de soleil a percé le ciel couvert lorsqu'il y a quelques années, chez Google, ils ont eu l'idée de ne pas échanger des tâches, mais plutôt de faire une chose commune.

Et si nous décrivions tout comme un code ?

En 2016, Google a publié un livre intitulé « Site Reliability Engineering » sur la transformation du rôle d'administrateur système : d'un maître de la magie à une approche d'ingénierie formalisée dans l'utilisation des logiciels et de l'automatisation. Eux-mêmes ont traversé toutes les épines et tous les obstacles, ont compris et ont décidé de le partager avec le monde. Le livre est dans le domaine public ici.

Le livre contient des vérités simples :

  • faire tout comme du code, c'est bien ;
  • utiliser une approche d'ingénierie - bien ;
  • faire un bon suivi, c’est bien ;
  • empêcher la publication d’un service s’il ne dispose pas d’une journalisation et d’une surveillance claires est également une bonne chose.

Ces pratiques ont été lues par notre Gleb (entropie), et c'est parti. Exécution! Nous sommes désormais dans une phase de transition. L'équipe SRE est formée (il y a 6 spécialistes prêts à l'emploi, 6 autres sont intégrés) et est prête à changer le monde, entièrement constitué de code, pour le mieux.

Nous créons notre infrastructure de manière à permettre aux développeurs de gérer leurs environnements et de collaborer de manière totalement autonome avec SRE.

Wang au lieu de conclusions

L'administrateur système est une profession digne. Mais la connaissance de la partie système nécessite également d’excellentes compétences en ingénierie logicielle.

Les systèmes deviennent de plus en plus simples, et les connaissances super uniques en matière d'administration des serveurs Iron sont de moins en moins demandées chaque année. Les technologies cloud remplacent le besoin de ces connaissances.

Dans un avenir proche, un bon administrateur système devra posséder de bonnes compétences en génie logiciel. Mieux encore, il devrait avoir de bonnes compétences dans ce domaine.

Personne ne sait prédire l’avenir avant qu’il ne se produise, mais nous pensons qu’avec le temps, de moins en moins d’entreprises voudront s’ajouter au personnel sans cesse pléthorique d’administrateurs système. Bien sûr, les fans resteront. Peu de gens montent à cheval aujourd'hui, utilisent principalement des voitures, bien qu'il y ait des amoureux...

Bonne journée des administrateurs système à tous, codez à tout le monde !

Source: habr.com

Ajouter un commentaire