オンライン SRE 集中型: すべてを徹底的に分解してから修正し、さらに数回分解してから再度構築します

何かを壊してみませんか? それ以外の場合は、建設して建設し、修理して修理します。 致命的な退屈。

この恥辱を称賛されるだけでなく、私たちに何も起こらないように、それを打ち破りましょう。 そして、すべてを再度構築します。これにより、桁違いに優れ、耐障害性が高まり、高速になります。

そしてまた壊してやる。

これは、私たちの宇宙飛行全体における最も秘密の道具であるロシアのビッグスペースハンマーを使用するコンテストだと思いますか?

いいえ、これはオンライン SRE 集中型です。 たまたま各コースで スラームSRE 決して以前のもののようにはなりません。 毎秒何千人ものユーザーが接続し、数百万人の視聴者がいる巨大で複雑なシステムでは、落ちたり、壊れたり、鈍くなったり、不具合が発生したり、その他何百もの方法で台無しになる可能性があるとは決して想像できないからです。 SREエンジニアの勤務交代の雰囲気。

XNUMX月にもまた開催します SRE集中型.

オンライン SRE 集中型: すべてを徹底的に分解してから修正し、さらに数回分解してから再度構築します

少し振り返ってみましょう。 ほんの数年前、人事部は誰が最も多くの DevOps エンジニアを自社に採用できるか競っていたことを思い出してください。 賞品が変わりました。 現在、Pantsir-S1 追跡システムと同様に、周囲の空間を検査し、SRE エンジニアを探しています。 という記事でもお話しましたが、Evgeniy Varavva、Google 開発者。 Google を 5 つの単語で説明する方法「Google の SRE エンジニアの生活はどのようなものなのか、そしてそのような企業ですら SRE スペシャリストが不足していることについて。

オンライン集中講座では スラームSRE 10 月の 00:19 から 00:XNUMX までの XNUMX 日間で、リソースが限られた状況で Web サイトの速度、耐障害性、可用性を確保し、IT インシデントを排除し、問題が再発しないように報告会を実施する方法を学びます。

コースの講演者:

イワン・クルグロフ。 Databricks のスタッフ ソフトウェア エンジニア。 エンタープライズ企業での分散メッセージ配信と処理、ビッグデータと Web スタック、検索、内部クラウドの構築、サービス メッシュの経験があります。

パベル・セリバノフ。 Mail.ru Cloud Solutions のシニア DevOps エンジニア。 私は数十の構築されたインフラストラクチャと何百もの書かれた CI/CD パイプラインを持っています。 認定された Kubernetes 管理者。 Kubernetes と DevOps に関するいくつかのコースの著者。 ロシアおよび国際的な IT カンファレンスで定期的に講演を行っています。

すべてが困難で、予測不可能で、実際には困難になるでしょう。 組み立てたり、壊したり、修理したりすることもありますが、その順序はまったく異なる場合もあります。

建てる: 複数のマイクロサービスで構成されるサイトの SLO、SLI、SLA 指標を策定する必要があります。 それらをサポートするアーキテクチャとインフラストラクチャを開発します。 サイトを組み立て、テストし、展開する。 監視とアラートを設定します。

壊す: SLO を悪化させる内部および外部の要因 (開発者のエラー、インフラストラクチャの障害、訪問者の流入、DoS 攻撃) を考慮します。 堅牢性、エラー バジェット、テスト方法、割り込み管理、運用ワークロードについて理解することを学びます。

修理: 可能な限り短時間で事故をなくすために、チームの作業を迅速かつ効果的に組織する方法、つまり同僚を巻き込み、利害関係者に通知し、優先順位を設定する方法を訓練されます。

勉強: SRE の観点からサイトへのアプローチを分析できるようになります。 インシデントを分析します。 将来的にそれらを回避する方法を決定します。監視を改善し、アーキテクチャを変更し、開発と運用のアプローチ、規制を変更します。 プロセスを自動化します。

オンライン SRE 集中 実際の状況をシミュレートします。サービスを復元する時間は非常に限られています。 現実の生活、実際の仕事の状況とまったく同じです。

SRE コースの条件を確認したり、プログラム全体を学習したりするには、次の URL をご覧ください。 リンク.

オンライン集中講座は2020年XNUMX月に予定されています。 事前に参加費をお支払いいただいた方には割引をご用意しております。

激しいトレーニング、非標準的な作業、突然の事故に対する準備はできていますか?

それは起こらないでしょう。 プロとしての成長もあるでしょう。

出所: habr.com

コメントを追加します