Slurm - Kubernetes トピックに侵入する簡単な方法

Slurm - Kubernetes トピックに侵入する簡単な方法

XNUMX 月に、Kubernetes に関するコースである Slurm の主催者が私のドアをノックしてテストし、感想を話してくれました。

Dmitry, Slurm は、Kubernetes に関する XNUMX 日間の集中コースであり、密度の高いトレーニング イベントです。 最初の講義でXNUMX時間座っただけでは書けそうにありません。 全面的に参加する準備はできていますか?

Slurm を導入する前は、ansible、docker、ceph に関する準備オンライン コースを受講する必要がありました。
次に、カブでコードと正確な指示を取得し、それに従って、講義で発表者と一緒に各コマンドを XNUMX 行ずつ実行します。

— 私は両方のコースに完全に参加する準備ができていることを確認します。

その後、システム管理者でいっぱいの教室で 6 日間のハードワーク (基本的な Slurm と MegaSlurm) が保証されます。

噴水

一般的にサービス開発の難しさは何ですか? たとえば、企業がプッシュ通知広告を求めているとします。 Web サイトを持つフルスタック開発者と、モバイル アプリケーションを持つモバイル開発者がいるように見えます。 15分のタスク。 業者にはXNUMX日で対応できると伝えましょう!

そしてここで、プッシュ通知がこれまで送信されたことがないことが判明しました。 事前に外部または自己ホスト型のプッシュ通知プラットフォームには接続しませんでした。 これは 15 分や XNUMX 時間ではなく、XNUMX 週間以内に接続できれば問題ありません。 魔法と魔法が始まりました。 すべてが不透明で、奇妙で、予測不可能です。

開発が完全に予測不可能になった理由はただ XNUMX つあります。それは、ビジネス タスクの層に加えて、インフラストラクチャ層も存在することを考慮していなかったということです。

ビジネス タスク層が多数の小さなタスク、仮説検証、視覚的なトリックを吐き出す噴水である場合、インフラストラクチャはそのパイプです。 ここでは、少なくとも XNUMX か月前の計画期間が必要です。

噴水用パイプ

複雑さと細部に細心の注意を払う必要があるため、特別な訓練を受けた人々が「パイプ」、つまり最も経験豊富な管理者と開発者から育った Devops を開発しています。 彼らの仕事は体系的で厳密に一貫しています。 彼らは橋を建設する業者のようなものです。少しでもミスをすると、15 分間の簡単なビジネス タスクが突然、何日も費用もかかるインフラストラクチャの再計画に変わってしまうという事実につながります。

現在、スラームは、標準化された方法でインフラを構築する方法を教え、少なくとも何らかの形で計画ミスを平準化することができる、ロシアで(私が知る限り)唯一のコースです。 私は Kubernetes のコースを受講しましたが、XNUMX 月に DevOps の新しいコースを受講する予定です。

スラームは、さまざまな形の噴水を数十基建設してきた管理アウトソーサーであるサウスブリッジによって発明されました。 Southbridge は KTP および KCSP 認定を受けています (CNCF、Linux Foundation メンバー)。

Kubernetes コースでは具体的に何を教えているのでしょうか?

開発者が行ったことすべてを、落ちないように整理するにはどうすればよいでしょうか?

  • Kubespray の使用
  • 追加コンポーネントのインストール
  • クラスターのテストとトラブルシューティング

ユーザー (開発者) がクラスター自体を操作するためにクラスターに参加することを承認するにはどうすればよいですか?

  • LDAP (Nginx + Python)
  • OIDC (デックス + ギャングウェイ)

ネットワークレベルでハッカーから身を守るにはどうすればよいでしょうか?

  • CNI の概要
  • ネットワークセキュリティポリシー

そして一般的には安全です!

  • ポッドセキュリティポリシー
  • ポッド中断予算

私たちは何も隠さず、内部にあるものを詳しくお伝えします

  • コントローラの構造
  • オペレーターと CRD

クラスター内のステートフル アプリケーション

  • 例として PostgreSQL を使用したデータベース クラスターの起動
  • RabbitMQ クラスターの開始

多数のパスワードと設定をクリアテキストで保存しない方法

  • Kubernetes でのシークレットの管理
  • ボールト

指を鳴らすだけで水平方向のスケーリングが可能

  • Теория
  • 練習

バックアップ

  • Heptio Velero (旧 Ark) と etcd を使用したクラスターのバックアップとリカバリ

テスト、ステージング、本番への導入が簡単

  • 糸くず
  • テンプレート化および展開ツール
  • 導入戦略

ステロイドに関するコースもあり、そこにあるものはすべてハードコアなものです。 ただし、基本コースを修了すると、すでに独自の噴水を構築できます。

Slurm の後、参加者には成果物が残されました。それは、一日中録画したビデオ、各アイテムの詳細な手順と正確なレシピ、そのコマンドは、バックアップ用のソリューションやソリューションを組み立てるために愚かにもコピー&ペーストできるものです。テスト環境など。

つまり、それはとても簡単です。 はい。 私は数日間ここに来て、このテーマに没頭し、正確なレシピを受け取り、職場に戻り、プロジェクトのインフラストラクチャを構築しました。これは、簡単に、正確に、そして最も重要なことに、予測可能な期間内に行われました。 魔法も魔術も終わった、あとは働くだけだ。

その結果は?

レースの終わりには、数日間、本当に本格的なプロジェクトがほぼ DevOps 自身によって構築されているという感覚を得ることができます。 そして驚くべきことは、取り上げられている内容はすべて理解できるものであり、私はそれを毎日自分のサーバーで再現しているということです。

幸いなことに、聴衆全員がカート チャットに移動しました。そこでは、何週間も経っても活気が保たれています。

次は何ですか?

主催者は秋に Slurm Devops を準備しており、私もすでに準備を始めています。 これについては近いうちに私の記事に書きます カート内の techdir チャネル @ctorecords.

出所: habr.com

コメントを追加します