Epopeja o administratorach systemu jako zagrożonym gatunku

Administratorzy systemów na całym świecie, gratulujemy profesjonalnych wakacji!

Nie mamy już administratorów systemu (no, prawie). Jednak legenda o nich jest wciąż świeża. Na cześć święta przygotowaliśmy ten epos. Rozsiądźcie się wygodnie, drodzy czytelnicy.

Epopeja o administratorach systemu jako zagrożonym gatunku

Dawno, dawno temu świat Dodo IS płonął. W tym mrocznym czasie głównym zadaniem naszych administratorów systemu było przeżyć jeszcze jeden dzień i nie płakać.

Dawno, dawno temu programiści pisali kod mało i powoli i zamieszczali go na prodzie tylko raz w tygodniu. Więc problemy pojawiały się tylko raz na siedem dni. Ale potem zaczęli pisać więcej kodu i publikować go częściej, problemy zaczęły się nasilać, czasami wszystko zaczęło się rozpadać, a wycofywanie stało się gorsze. Administratorzy systemu cierpieli, ale tolerowali tę farsę.

Siedzieli wieczorami w domu z niepokojem w duszy. I za każdym razem „to się nie zdarzyło, a tu znowu monitoring wysyła sygnał o pomoc: Stary, świat się pali!”. Następnie nasi administratorzy systemu włożyli czerwone płaszcze przeciwdeszczowe, szorty na legginsy, zakręcili czoła i polecieli ratować świat Dodo.

Uwaga, małe wyjaśnienie. Nigdy nie było klasycznych administratorów systemu, którzy opiekują się sprzętem w Dodo IS. Od razu zrobiliśmy postępy w chmurach Azure.

Co oni zrobili:

  • jeśli coś się zepsuło, zrobili to tak, że zostało to naprawione;
  • żonglował serwerami na poziomie eksperckim;
  • byli odpowiedzialni za sieć wirtualną na Azure;
  • były odpowiedzialne za rzeczy niskiego poziomu, na przykład interakcje komponentów (*szepty*, w których czasami nie grzebały);
  • ponowne połączenie z serwerem;
  • i wiele innych dzikich.

Życie zespołu inżynierów infrastruktury (tak nazywaliśmy naszych administratorów systemu) składało się wtedy z gaszenia pożarów i ciągłego niszczenia stanowisk testowych. Żyli i opłakiwali, a potem postanowili pomyśleć: dlaczego jest tak źle, a może stać nas na więcej? Czy na przykład nie podzielimy ludzi na programistów i administratorów systemów?

problem

Biorąc pod uwagę: jest administrator systemu, który ma serwery w swoim obszarze odpowiedzialności, sieć, która łączy go z innymi serwerami, programy na poziomie infrastruktury (serwer WWW, na którym znajduje się aplikacja, system zarządzania bazą danych itp.). I jest programista, którego obszarem odpowiedzialności jest działający kod.

I są rzeczy, które są na skrzyżowaniu. Czyja to odpowiedzialność?

Zazwyczaj właśnie na tym skrzyżowaniu spotykali się nasi administratorzy systemów i programiści i zaczynało się:

„Ludzie, nic nie działa, prawdopodobnie z powodu infrastruktury.
- Stary, nie, to jest w kodzie.

Pewnego dnia w tym momencie zaczęło między nimi rosnąć ogrodzenie, przez które radośnie rzucali kupę. Zadanie, jak kupa, rzucano z jednej strony płotu na drugą. Jednocześnie nikt nie zbliżył się do rozwiązania sytuacji. Smutna buźka.

Promień słońca przebił się przez zachmurzone niebo, gdy kilka lat temu w Google wpadli na pomysł, żeby nie wymieniać się zadaniami, tylko robić wspólną rzecz.

Ale co, jeśli opiszemy wszystko jako kod?

W 2016 roku Google wydało książkę zatytułowaną „Site Reliability Engineering” o transformacji roli administratora systemu: od mistrza magii do sformalizowanego inżynierskiego podejścia do korzystania z oprogramowania i automatyzacji. Sami przeszli przez wszystkie ciernie i przeszkody, opanowali to i postanowili podzielić się tym ze światem. Książka jest w domenie publicznej tutaj.

Książka zawiera proste prawdy:

  • robienie wszystkiego zgodnie z kodem jest dobre;
  • stosować podejście inżynierskie - dobrze;
  • robienie dobrego monitoringu jest dobre;
  • zapobieganie zwolnieniu usługi, jeśli nie ma wyraźnego logowania i monitorowania, jest również dobre.

Te praktyki przeczytał nasz Gleb (entropia) i ruszamy. Realizowanie! Teraz jesteśmy w fazie przejściowej. Powstaje zespół SRE (jest 6 gotowych specjalistów, 6 kolejnych jest w trakcie onboardingu) i jest gotowy zmieniać na lepsze świat składający się wyłącznie z kodu.

Tworzymy naszą infrastrukturę w taki sposób, aby deweloperzy mogli całkowicie samodzielnie zarządzać swoimi środowiskami i współpracować z SRE.

Wang zamiast wniosków

Administrator systemu to godny zawód. Ale znajomość części systemowej wymaga również doskonałych umiejętności inżynierii oprogramowania.

Systemy stają się coraz prostsze, a wyjątkowa wiedza na temat administrowania żelaznymi serwerami z każdym rokiem staje się coraz mniej pożądana. Technologie chmurowe zastępują potrzebę tej wiedzy.

Dobry administrator systemu w niedalekiej przyszłości będzie musiał posiadać dobre umiejętności inżynierii oprogramowania. Co więcej, powinien mieć dobre umiejętności w tej dziedzinie.

Nikt nie wie, jak przewidzieć przyszłość, zanim ona nastąpi, ale wierzymy, że z czasem będzie coraz mniej firm, które będą chciały powiększać niekończącą się liczbę administratorów systemu. Chociaż oczywiście fani pozostaną. Niewielu dziś jeździ konno, najczęściej samochodami, choć zdarzają się zakochani...

Szczęśliwego dnia sysadmin wszystkim, kod dla wszystkich!

Źródło: www.habr.com

Dodaj komentarz