O épico sobre administradores de sistema como uma espécie em extinção

Administradores de sistemas de todo o mundo, parabéns pelas suas férias profissionais!

Não temos mais administradores de sistema (bem, quase). No entanto, a lenda sobre eles ainda está fresca. Em homenagem ao feriado, preparamos este épico. Fiquem à vontade, queridos leitores.

O épico sobre administradores de sistema como uma espécie em extinção

Era uma vez o mundo de Dodo IS estava pegando fogo. Durante aquele período sombrio, a principal tarefa de nossos administradores de sistema era sobreviver mais um dia e não chorar.

Há muito tempo, os programadores escreviam pouco e lentamente o código e o postavam no prod apenas uma vez por semana. Portanto, os problemas surgiam apenas uma vez a cada sete dias. Mas então eles começaram a escrever mais código e postá-lo com mais frequência, os problemas começaram a aumentar, às vezes tudo começou a desmoronar e piorou a reversão. Os administradores do sistema sofreram, mas toleraram essa farsa.

Eles se sentavam em casa à noite com ansiedade em suas almas. E toda vez que acontecia “nunca aconteceu, e aqui de novo a monitoração manda sinal de socorro: cara, o mundo tá pegando fogo!”. Em seguida, nossos administradores de sistema vestiram suas capas de chuva vermelhas, shorts sobre perneiras, fizeram uma careta na testa e voaram para salvar o mundo Dodo.

Atenção, uma pequena explicação. Nunca houve administradores de sistema clássicos que mantêm hardware no Dodo IS. Imediatamente avançamos nas nuvens do Azure.

O que eles fizeram:

  • se algo quebrou, eles fizeram para que fosse consertado;
  • servidores manipulados em nível de especialista;
  • foram responsáveis ​​pela rede virtual no Azure;
  • responsável por coisas de baixo nível, por exemplo, as interações dos componentes (*sussurrando* em que às vezes não se atrapalhavam);
  • servidor reconecta;
  • e muitos outros selvagens.

A vida de uma equipe de engenheiros de infra-estrutura (como chamávamos nossos administradores de sistema) consistia então em apagar incêndios e constantemente quebrar bancadas de teste. Eles viveram e sofreram, e então decidiram pensar: por que é tão ruim, ou talvez possamos fazer melhor? Por exemplo, não vamos dividir as pessoas em programadores e administradores de sistema?

tarefa

Dado: existe um administrador de sistema que possui servidores em sua área de responsabilidade, uma rede que o conecta a outros servidores, programas em nível de infraestrutura (um servidor web que hospeda uma aplicação, um sistema de gerenciamento de banco de dados, etc.). E existe um programador cuja área de responsabilidade é o código de trabalho.

E há coisas que estão na junção. De quem é essa responsabilidade?

Normalmente, nossos administradores de sistema e programadores se encontravam neste cruzamento e começava:

“Caras, nada funciona, provavelmente por causa da infraestrutura.
- Cara, não, está no código.

Um dia, neste momento, uma cerca começou a crescer entre eles, através da qual eles alegremente jogaram cocô. A tarefa, como um cocô, foi jogada de um lado da cerca para o outro. Ao mesmo tempo, ninguém chegou perto de resolver a situação. Sorriso triste.

Um raio de sol perfurou o céu nublado quando, alguns anos atrás, no Google, eles tiveram a ideia de não trocar tarefas, mas fazer uma coisa comum.

Mas e se descrevermos tudo como um código?

Em 2016, o Google lançou um livro chamado "Site Reliability Engineering" sobre a transformação do papel de um administrador de sistema: de um mestre da magia a uma abordagem de engenharia formalizada no uso de software e automação. Eles mesmos passaram por todos os espinhos e obstáculos, pegaram o jeito e decidiram compartilhar com o mundo. O livro está em domínio público aqui.

O livro contém verdades simples:

  • fazer tudo como código é bom;
  • use uma abordagem de engenharia - bom;
  • fazer um bom monitoramento é bom;
  • impedir que um serviço seja liberado se não tiver registro e monitoramento claros também é bom.

Essas práticas foram lidas por nosso Gleb (entropia), e lá vamos nós. Implementando! Agora estamos em um estágio de transição. A equipe SRE está formada (são 6 especialistas prontos, mais 6 estão onboarding) e está pronta para mudar o mundo, inteiramente de código, para melhor.

Criamos nossa infraestrutura de forma a permitir que os desenvolvedores gerenciem seus ambientes e colaborem com o SRE de forma totalmente independente.

Wang em vez de conclusões

O administrador do sistema é uma profissão digna. Mas o conhecimento da parte do sistema também requer excelentes habilidades de engenharia de software.

Os sistemas estão se tornando cada vez mais simples, e o conhecimento super exclusivo da administração de servidores de ferro está se tornando menos procurado a cada ano. As tecnologias de nuvem estão substituindo a necessidade desse conhecimento.

Um bom administrador de sistema em um futuro próximo terá que ter boas habilidades de engenharia de software. Melhor ainda, ele deve ter boas habilidades nessa área.

Ninguém sabe como prever o futuro antes que ele aconteça, mas acreditamos que com o tempo haverá cada vez menos empresas que desejam aumentar a equipe infinitamente inchada de administradores de sistema. Embora, é claro, os fãs permaneçam. Poucos hoje andam a cavalo, principalmente usam carros, embora existam amantes ...

Feliz dia do administrador de sistema a todos, código a todos!

Fonte: habr.com

Adicionar um comentário