SRE en ligne intensif : nous allons tout démonter, puis nous le réparerons, nous le casserons encore quelques fois, puis nous le reconstruirons

Cassons quelque chose, d'accord ? Sinon, nous construisons et construisons, réparons et réparons. L'ennui mortel.

Brisons-le pour qu'il ne nous arrive rien - non seulement nous serons félicités pour cette honte. Et puis nous reconstruirons tout - à tel point que ce sera d'un ordre de grandeur meilleur, plus tolérant aux pannes et plus rapide.

Et nous le briserons à nouveau.

Pensez-vous qu'il s'agit d'un concours pour utiliser l'instrument le plus secret de toute notre cosmonautique - le gros marteau spatial russe ?

Non, il s'agit d'un cours intensif SRE en ligne. Il se trouve que chaque cours Slurm SRE jamais et jamais comme le précédent. Tout simplement parce que vous ne devinerez jamais que dans un énorme système complexe, auquel des milliers et des milliers d'utilisateurs se connectent chaque seconde, et dont l'audience elle-même compte plusieurs millions, il peut tomber, se briser, devenir ennuyeux, avoir des problèmes et, de centaines d'autres manières, se ruiner. l'ambiance du quart de travail des ingénieurs SRE.

En décembre, nous organiserons un autre SRE intensif.

SRE en ligne intensif : nous allons tout démonter, puis nous le réparerons, nous le casserons encore quelques fois, puis nous le reconstruirons

Faisons une petite rétrospective. Rappelez-vous qu'il y a quelques années à peine, les RH se précipitaient pour voir qui pourrait embaucher le plus d'ingénieurs DevOps dans leur entreprise. Le prix a changé. Désormais, à l’instar du système de suivi Pantsir-S1, ils inspectent l’espace environnant et recherchent les ingénieurs SRE. J'en ai parlé dans l'article "Evgeniy Varavva, développeur chez Google. Comment décrire Google en 5 mots"À quoi ressemble la vie d'un ingénieur SRE chez Google et comment même une telle entreprise connaît une pénurie de spécialistes SRE.

Au cours intensif en ligne Slurm SRE en décembre, en trois jours, de 10h00 à 19h00, vous apprendrez à assurer la rapidité, la tolérance aux pannes et la disponibilité des sites Internet dans des conditions de ressources limitées, à éliminer les incidents informatiques et à procéder au débriefing pour que les problèmes ne se reproduisent pas.

Intervenants du cours :

Ivan Kruglov. Ingénieur logiciel chez Databricks. Possède de l'expérience dans des entreprises dans la livraison et le traitement distribués de messages, le BigData et la pile Web, la recherche, la création d'un cloud interne et le maillage de services.

Pavel Selivanov. Ingénieur DevOps senior chez Mail.ru Cloud Solutions. J'ai des dizaines d'infrastructures construites et des centaines de pipelines CI/CD écrits. Administrateur Kubernetes certifié. Auteur de plusieurs cours sur Kubernetes et DevOps. Conférencier régulier lors de conférences informatiques russes et internationales.

Tout sera difficile, imprévisible et pratique. Vous construirez, casserez et réparerez - et parfois dans des séquences très différentes.

Construire: Vous devrez formuler des indicateurs SLO, SLI, SLA pour un site composé de plusieurs microservices ; développer l'architecture et l'infrastructure qui les soutiendront ; assembler, tester et déployer le site ; mettre en place une surveillance et des alertes.

Casser: Vous prendrez en compte les facteurs internes et externes qui détériorent le SLO : erreurs des développeurs, pannes d'infrastructure, afflux de visiteurs, attaques DoS. Apprenez à comprendre la robustesse, le budget d’erreurs, les pratiques de test, la gestion des interruptions et la charge de travail opérationnelle.

Réparation: Vous serez formé pour organiser rapidement et efficacement le travail d'une équipe afin d'éliminer un accident dans les plus brefs délais : impliquer vos collègues, informer les parties prenantes et fixer les priorités.

Étude: Vous pourrez analyser l'approche du chantier d'un point de vue SRE. Analyser les incidents. Déterminez comment les éviter à l'avenir : améliorer la surveillance, modifier l'architecture, les approches de développement et d'exploitation, la réglementation. Automatisez les processus.

SRE intensif en ligne simule des conditions réelles - le temps de restauration du service sera extrêmement limité. Comme dans la vraie vie, comme dans une vraie situation de travail.

Vous pouvez découvrir les modalités du cours SRE, ainsi qu'étudier le programme complet sur lien.

L'intensif en ligne est prévu pour décembre 2020. Pour ceux qui paient leur participation à l’avance, nous avons préparé une réduction.

Êtes-vous prêt à affronter un entraînement intense, des tâches atypiques et des accidents soudains ?

Cela n’arrivera tout simplement pas. Il y aura une croissance professionnelle.

Source: habr.com

Ajouter un commentaire