SRE online intensivo: vamos quebrar tudo, depois consertar, quebrar mais algumas vezes e depois construir novamente

Vamos quebrar alguma coisa, certo? Caso contrário, construímos e construímos, reparamos e reparamos. Tédio mortal.

Vamos quebrá-lo para que nada nos aconteça por isso - não apenas seremos elogiados por esta desgraça. E então construiremos tudo de novo - tanto que será uma ordem de grandeza melhor, mais tolerante a falhas e mais rápido.

E vamos quebrá-lo novamente.

Você acha que esta é uma competição para usar o instrumento mais secreto de toda a nossa cosmonáutica - o Grande Martelo Espacial Russo?

Não, este é um SRE online intensivo. Acontece que cada curso Slurm SRE nunca e nunca como o anterior. Simplesmente porque você nunca imagina que em um sistema enorme e complexo, ao qual milhares e milhares de usuários se conectam a cada segundo, e o público em si é de vários milhões, ele pode cair, quebrar, tornar-se monótono, apresentar falhas e, de centenas de outras maneiras, arruinar. o clima da mudança de plantão dos engenheiros do SRE.

Em dezembro realizaremos mais um SRE intensivo.

SRE online intensivo: vamos quebrar tudo, depois consertar, quebrar mais algumas vezes e depois construir novamente

Vamos fazer uma pequena retrospectiva. Lembre-se de como, há apenas alguns anos, o RH corria para ver quem poderia contratar mais engenheiros de DevOps para sua empresa. O prêmio mudou. Agora, assim como o sistema de rastreamento Pantsir-S1, eles inspecionam o espaço circundante e procuram engenheiros do SRE. Falei no artigo “Evgeniy Varavva, desenvolvedor do Google. Como descrever o Google em 5 palavras“Como é a vida de um engenheiro de SRE no Google e como até mesmo uma empresa desse tipo enfrenta escassez de especialistas em SRE.

No intensivo online Slurm SRE em dezembro, em três dias, das 10h00 às 19h00, você aprenderá como garantir a velocidade, tolerância a falhas e disponibilidade dos sites em condições de recursos limitados, eliminar incidentes de TI e realizar debriefing para que os problemas não se repitam.

Palestrantes do curso:

Ivan Kruglov. Engenheiro de software da equipe da Databricks. Tem experiência em empresas corporativas em entrega e processamento distribuído de mensagens, BigData e web-stack, pesquisa, construção de nuvem interna, service mesh.

Pavel Selivanov. Engenheiro DevOps Sênior na Mail.ru Cloud Solutions. Tenho dezenas de infraestruturas construídas e centenas de pipelines de CI/CD escritos. Administrador certificado do Kubernetes. Autor de diversos cursos sobre Kubernetes e DevOps. Palestrante regular em conferências russas e internacionais de TI.

Tudo será difícil, imprevisível e prático. Você construirá, quebrará e consertará - e às vezes em sequências muito diferentes.

Construir: Você terá que formular indicadores de SLO, SLI, SLA para um site composto por diversos microsserviços; desenvolver a arquitetura e a infraestrutura que os apoiará; montar, testar e implantar o site; configurar monitoramento e alertas.

Quebrar: Você considerará fatores internos e externos que deterioram o SLO: erros do desenvolvedor, falhas de infraestrutura, fluxo de visitantes, ataques DoS. Aprenda a compreender a resiliência, o orçamento de erros, as práticas de teste, o gerenciamento de interrupções e a carga de trabalho operacional.

Reparar: Você será treinado para organizar de forma rápida e eficaz o trabalho de uma equipe para eliminar um acidente no menor tempo possível: envolver colegas, notificar as partes interessadas e definir prioridades.

Estudar: Você poderá analisar a abordagem do site do ponto de vista do SRE. Analise incidentes. Determine como evitá-los no futuro: melhore o monitoramento, mude a arquitetura, abordagens de desenvolvimento e operação, regulamentações. Automatize processos.

Intensivo SRE on-line simula condições reais - o tempo para restaurar o serviço será extremamente limitado. Tal como na vida real, tal como numa situação real de trabalho.

Você pode conhecer os termos do curso SRE, bem como estudar o programa completo em link.

O intensivo online está planejado para dezembro de 2020. Para quem paga a participação antecipadamente, preparamos um desconto.

Você está pronto para treinamentos intensos, tarefas fora do padrão e acidentes repentinos?

Isso simplesmente não vai acontecer. Haverá crescimento profissional.

Fonte: habr.com

Adicionar um comentário