Das Epos über Systemadministratoren als bedrohte Spezies

Systemadministratoren auf der ganzen Welt, herzlichen Glückwunsch zu Ihrem Berufsurlaub!

Wir haben keine Systemadministratoren mehr (naja, fast). Die Legende über sie ist jedoch noch frisch. Zu Ehren des Feiertags haben wir dieses Epos vorbereitet. Machen Sie es sich bequem, liebe Leser.

Das Epos über Systemadministratoren als bedrohte Spezies

Es war einmal, als die Welt von Dodo IS in Flammen stand. In dieser dunklen Zeit bestand die Hauptaufgabe unserer Systemadministratoren darin, noch einen Tag zu überleben und nicht zu weinen.

Vor langer Zeit schrieben Programmierer wenig und langsam Code und veröffentlichten ihn nur einmal pro Woche auf Prod. Probleme traten also nur einmal alle sieben Tage auf. Aber dann begannen sie, mehr Code zu schreiben und ihn häufiger zu veröffentlichen, die Probleme nahmen zu, manchmal begann alles auseinanderzufallen und es wurde immer schlimmer, einen Rollback durchzuführen. Systemadministratoren litten zwar, tolerierten diese Farce aber.

Abends saßen sie zu Hause und hatten Angst im Herzen. Und jedes Mal, wenn es passierte, „ist es nie passiert, und auch hier sendet die Überwachung ein Signal zur Hilfe: Alter, die Welt brennt!“. Dann zogen unsere Systemadministratoren ihre roten Regenmäntel an, Shorts über Leggings, machten eine Locke auf der Stirn und flogen, um die Dodo-Welt zu retten.

Achtung, eine kleine Erklärung. Es gab noch nie klassische Systemadministratoren, die in Dodo IS die Hardware warten. Wir hatten sofort Fortschritte bei Azure-Clouds gemacht.

Was haben Sie gemacht:

  • wenn etwas kaputt ging, sorgten sie dafür, dass es repariert wurde;
  • jonglierte Server auf Expertenniveau;
  • waren für das virtuelle Netzwerk in Azure verantwortlich;
  • verantwortlich für Dinge auf niedriger Ebene, zum Beispiel die Interaktionen von Komponenten (*Flüstern*, bei dem sie manchmal nicht herumfummelten);
  • Server verbindet sich erneut;
  • und viele andere wilde.

Das Leben eines Teams von Infrastrukturingenieuren (wie wir unsere Systemadministratoren nannten) bestand damals aus dem Löschen von Bränden und dem ständigen Zerstören von Prüfständen. Sie lebten und trauerten, und dann beschlossen sie zu denken: Warum ist es so schlimm, oder können wir es vielleicht besser machen? Werden wir die Menschen zum Beispiel nicht in Programmierer und Systemadministratoren einteilen?

Problem

Mai: Es gibt einen Systemadministrator, der Server in seinem Verantwortungsbereich hat, ein Netzwerk, das ihn mit anderen Servern verbindet, Programme auf Infrastrukturebene (einen Webserver, der eine Anwendung hostet, ein Datenbankverwaltungssystem usw.). Und es gibt einen Programmierer, dessen Verantwortungsbereich das Arbeiten am Code ist.

Und es gibt Dinge, die an der Kreuzung stehen. Wessen Verantwortung liegt hier?

Normalerweise trafen sich unsere Systemadministratoren und Programmierer genau an dieser Kreuzung und es begann:

„Leute, nichts funktioniert, wahrscheinlich wegen der Infrastruktur.
- Alter, nein, es steht im Code.

Eines Tages begann zwischen ihnen ein Zaun zu wachsen, durch den sie voller Freude Kot warfen. Die Aufgabe wurde wie ein Kot von einer Seite des Zauns auf die andere geworfen. Gleichzeitig gelang es niemandem, die Situation auch nur annähernd zu lösen. Trauriger Smiley.

Ein Sonnenstrahl durchdrang den bedeckten Himmel, als man vor einigen Jahren bei Google auf die Idee kam, Aufgaben nicht auszutauschen, sondern eine gemeinsame Sache zu erledigen.

Aber was wäre, wenn wir alles als Code beschreiben würden?

Im Jahr 2016 veröffentlichte Google ein Buch mit dem Titel „Site Reliability Engineering“ über den Wandel der Rolle eines Systemadministrators: vom Meister der Magie zu einem formalisierten Engineering-Ansatz beim Einsatz von Software und Automatisierung. Sie selbst sind durch alle Dornen und Hindernisse gegangen, haben den Dreh raus und beschlossen, es mit der Welt zu teilen. Das Buch ist gemeinfrei hier.

Das Buch enthält einfache Wahrheiten:

  • Alles als Code zu machen ist gut;
  • einen technischen Ansatz verwenden – gut;
  • Eine gute Überwachung ist gut;
  • Es ist auch gut, zu verhindern, dass ein Dienst freigegeben wird, wenn er nicht über eine klare Protokollierung und Überwachung verfügt.

Diese Praktiken wurden von unserem Gleb gelesen (Entropie), Und weg gehen wir. Umsetzung! Jetzt befinden wir uns in einer Übergangsphase. Das SRE-Team ist gebildet (es gibt 6 fertige Spezialisten, 6 weitere sind im Onboarding) und ist bereit, die Welt, die ausschließlich aus Code besteht, zum Besseren zu verändern.

Wir gestalten unsere Infrastruktur so, dass Entwickler ihre Umgebungen völlig unabhängig verwalten und mit SRE zusammenarbeiten können.

Wang statt Schlussfolgerungen

Systemadministrator ist ein würdiger Beruf. Kenntnisse über den Systemteil erfordern aber auch ausgezeichnete Fähigkeiten im Software-Engineering.

Systeme werden immer einfacher und einzigartige Kenntnisse in der Verwaltung von Eisenservern werden von Jahr zu Jahr weniger gefragt. Cloud-Technologien ersetzen den Bedarf an diesem Wissen.

Ein guter Systemadministrator muss in naher Zukunft über gute Kenntnisse im Software-Engineering verfügen. Noch besser: Er sollte über gute Kenntnisse in diesem Bereich verfügen.

Niemand weiß, wie man die Zukunft vorhersagt, bevor sie eintritt, aber wir glauben, dass es im Laufe der Zeit immer weniger Unternehmen geben wird, die das endlos aufgeblähte Personal der Systemadministratoren verstärken möchten. Obwohl die Fans natürlich bleiben werden. Heutzutage reiten nur noch wenige, die meisten benutzen Autos, obwohl es Liebhaber gibt ...

Allen einen schönen Systemadministratortag, Code an alle!

Source: habr.com

Kommentar hinzufügen