何かを壊してみませんか? それ以外の場合は、建設して建設し、修理して修理します。 致命的な退屈。
この恥辱を称賛されるだけでなく、私たちに何も起こらないように、それを打ち破りましょう。 そして、すべてを再度構築します。これにより、桁違いに優れ、耐障害性が高まり、高速になります。
そしてまた壊してやる。
これは、私たちの宇宙飛行全体における最も秘密の道具であるロシアのビッグスペースハンマーを使用するコンテストだと思いますか?
いいえ、これはオンライン SRE 集中型です。 たまたま各コースで
XNUMX月にもまた開催します
少し振り返ってみましょう。 ほんの数年前、人事部は誰が最も多くの DevOps エンジニアを自社に採用できるか競っていたことを思い出してください。 賞品が変わりました。 現在、Pantsir-S1 追跡システムと同様に、周囲の空間を検査し、SRE エンジニアを探しています。 という記事でもお話しましたが、
オンライン集中講座では
コースの講演者:
イワン・クルグロフ。 Databricks のスタッフ ソフトウェア エンジニア。 エンタープライズ企業での分散メッセージ配信と処理、ビッグデータと Web スタック、検索、内部クラウドの構築、サービス メッシュの経験があります。
パベル・セリバノフ。 Mail.ru Cloud Solutions のシニア DevOps エンジニア。 私は数十の構築されたインフラストラクチャと何百もの書かれた CI/CD パイプラインを持っています。 認定された Kubernetes 管理者。 Kubernetes と DevOps に関するいくつかのコースの著者。 ロシアおよび国際的な IT カンファレンスで定期的に講演を行っています。
すべてが困難で、予測不可能で、実際には困難になるでしょう。 組み立てたり、壊したり、修理したりすることもありますが、その順序はまったく異なる場合もあります。
建てる: 複数のマイクロサービスで構成されるサイトの SLO、SLI、SLA 指標を策定する必要があります。 それらをサポートするアーキテクチャとインフラストラクチャを開発します。 サイトを組み立て、テストし、展開する。 監視とアラートを設定します。
壊す: SLO を悪化させる内部および外部の要因 (開発者のエラー、インフラストラクチャの障害、訪問者の流入、DoS 攻撃) を考慮します。 堅牢性、エラー バジェット、テスト方法、割り込み管理、運用ワークロードについて理解することを学びます。
修理: 可能な限り短時間で事故をなくすために、チームの作業を迅速かつ効果的に組織する方法、つまり同僚を巻き込み、利害関係者に通知し、優先順位を設定する方法を訓練されます。
勉強: SRE の観点からサイトへのアプローチを分析できるようになります。 インシデントを分析します。 将来的にそれらを回避する方法を決定します。監視を改善し、アーキテクチャを変更し、開発と運用のアプローチ、規制を変更します。 プロセスを自動化します。
SRE コースの条件を確認したり、プログラム全体を学習したりするには、次の URL をご覧ください。
オンライン集中講座は2020年XNUMX月に予定されています。 事前に参加費をお支払いいただいた方には割引をご用意しております。
激しいトレーニング、非標準的な作業、突然の事故に対する準備はできていますか?
それは起こらないでしょう。 プロとしての成長もあるでしょう。
出所: habr.com