Vamos quebrar alguma coisa, certo? Caso contrário, construímos e construímos, reparamos e reparamos. Tédio mortal.
Vamos quebrá-lo para que nada nos aconteça por isso - não apenas seremos elogiados por esta desgraça. E então construiremos tudo de novo - tanto que será uma ordem de grandeza melhor, mais tolerante a falhas e mais rápido.
E vamos quebrá-lo novamente.
Você acha que esta é uma competição para usar o instrumento mais secreto de toda a nossa cosmonáutica - o Grande Martelo Espacial Russo?
Não, este é um SRE online intensivo. Acontece que cada curso
Em dezembro realizaremos mais um
Vamos fazer uma pequena retrospectiva. Lembre-se de como, há apenas alguns anos, o RH corria para ver quem poderia contratar mais engenheiros de DevOps para sua empresa. O prêmio mudou. Agora, assim como o sistema de rastreamento Pantsir-S1, eles inspecionam o espaço circundante e procuram engenheiros do SRE. Falei no artigo “
No intensivo online
Palestrantes do curso:
Ivan Kruglov. Engenheiro de software da equipe da Databricks. Tem experiência em empresas corporativas em entrega e processamento distribuído de mensagens, BigData e web-stack, pesquisa, construção de nuvem interna, service mesh.
Pavel Selivanov. Engenheiro DevOps Sênior na Mail.ru Cloud Solutions. Tenho dezenas de infraestruturas construídas e centenas de pipelines de CI/CD escritos. Administrador certificado do Kubernetes. Autor de diversos cursos sobre Kubernetes e DevOps. Palestrante regular em conferências russas e internacionais de TI.
Tudo será difícil, imprevisível e prático. Você construirá, quebrará e consertará - e às vezes em sequências muito diferentes.
Construir: Você terá que formular indicadores de SLO, SLI, SLA para um site composto por diversos microsserviços; desenvolver a arquitetura e a infraestrutura que os apoiará; montar, testar e implantar o site; configurar monitoramento e alertas.
Quebrar: Você considerará fatores internos e externos que deterioram o SLO: erros do desenvolvedor, falhas de infraestrutura, fluxo de visitantes, ataques DoS. Aprenda a compreender a resiliência, o orçamento de erros, as práticas de teste, o gerenciamento de interrupções e a carga de trabalho operacional.
Reparar: Você será treinado para organizar de forma rápida e eficaz o trabalho de uma equipe para eliminar um acidente no menor tempo possível: envolver colegas, notificar as partes interessadas e definir prioridades.
Estudar: Você poderá analisar a abordagem do site do ponto de vista do SRE. Analise incidentes. Determine como evitá-los no futuro: melhore o monitoramento, mude a arquitetura, abordagens de desenvolvimento e operação, regulamentações. Automatize processos.
Você pode conhecer os termos do curso SRE, bem como estudar o programa completo em
O intensivo online está planejado para dezembro de 2020. Para quem paga a participação antecipadamente, preparamos um desconto.
Você está pronto para treinamentos intensos, tarefas fora do padrão e acidentes repentinos?
Isso simplesmente não vai acontecer. Haverá crescimento profissional.
Fonte: habr.com