- Slurm 確實可以讓您進入 Kubernetes 主題或提高您的知識。
- 參與者都很高興。只有少數人沒有學到任何新東西或沒有解決他們的問題。第一天的無條件退款(「如果你覺得Slurm不適合你,我們將退還門票全價」)只有一個人使用,證明他高估了自己的實力。
- 下一次 Slurm 將於九月初在聖彼得堡舉行。我們的永久贊助商 Selectel 不僅提供雲端展台,還提供自己的會議室。
- 我們正在重複基本的 Slurm(9 月 11 日至 4 日)並引入一個新計劃:DevOps Slurm(6 月 XNUMX 日至 XNUMX 日)。
Slurm 是什麼?它有何變化?
一年前,我們提出了開設 Kubernetes 課程的想法。 18 年 1 月,Slurm-XNUMX 舉行:困難,持續的預演(當演示在舞台上完成時),有一堆日常問題。試煉團結起來:第一次 Slurm 的參與者,就像指環王一樣,仍然互相溝通。
這就是 Slurm-1 的樣子
在第一次 Slurm 時,舉辦 MegaSlurm 的想法就誕生了。我們詢問人們對哪些主題感興趣,並於 19 月「應參與者的要求」舉辦了高級課程。事實證明這是一次有趣但一次性的活動。到 XNUMX 年 XNUMX 月,我們已經準備好了真正的高級課程,有它自己的邏輯和內部歷史。
在這一年裡,Slurm 在組織上發生了變化:
— Docker 和 Anisble 從主程式中刪除,並製作了單獨的線上課程。
— 有組織的技術支持,幫助學生解決學習集群問題。
— 發言者現在得到了方法論上的支持。
《Slurm 4》的製作團隊
參與者的回饋
另一項記錄被創造:基本 Slurm 的參與者有 170 人,MegaSlurm 的參與者有 75 人。
Slurm-4
101 人中有 170 人填寫了回饋表。
Kubernetes 變得清晰了嗎?
41 — 我還不了解 k8s,但我知道該在哪裡挖掘。
36 — 我以前不知道k8s,但現在我明白了。
23 — 我以前了解 k8s,但現在我了解更多了。
1 - 我沒有學到任何新東西。
0——我對k8s一無所知。
你覺得 Slurm 的強度如何?
16 人認為 Slurm 太簡單太慢,14 人認為太難太快。適合其餘的。
你解決了你要 Slurm 遇到的問題了嗎?
90 - 是的。
11 - 沒有。
巨型泥漿
40 人填寫了回饋表。 2 個人說太簡單而且太慢。 1 個人沒有解決他要去 Mega 的問題。其餘的都還好。
演講者評論
如果說二月的聖彼得堡 Slurm 上大部分都是初學者,那麼莫斯科 Slurm 上就有大量人嘗試過 Kubernetes。有很多高級問題讓你思考。
如果在聖彼得堡他們問我們什麼時候會發布我們的 kubespray 分叉,那麼在莫斯科他們已經問我們為什麼建議使用我們的分叉而不採用原來的 kubespray。這已經是中老年人的批判性思考了。
練習很困難,人們犯了很多錯誤,這很好:你需要在學習時犯錯,而不是在戰鬥中犯錯。
我們經常遇到取得憑證的限制、Github 下載的限制等。這就是生活 - 我們在 Selectel 雲端同時部署了大約 200 個叢集。沒有人為此準備資源和限制。
Selectel 的 Slurm 公告
→
價格:25₽
程序:
主題#1:Kubernetes 簡介,主要元件
— k8s 技術簡介。描述、應用、概念
— Pod、ReplicaSet、部署、服務、入口、PV、PVC、ConfigMap、Secret
主題二:集群設計、主要組件、容錯、k2s網絡
— 集群設計、主要組件、容錯
— k8s 網絡
主題 #3:Kubespray、調整和設定 Kubernetes 集群
— Kubespray,Kubernetes 叢集的設定和調優
主題#4:高級 Kubernetes 抽象
- DaemonSet、StatefulSet、RBAC、Job、CronJob、Pod 排程、InitContainer
主題#5:發布服務和應用程式
— 服務發布方式概述:NodePort vs LoadBalancer vs Ingress
— 入口控制器 (Nginx):平衡傳入流量
— cert-manager:自動取得SSL/TLS憑證
主題#6:Helm 簡介
主題#7:安裝憑證管理器
主題#8:Ceph:「跟我一樣」安裝
主題#9:日誌記錄和監控
— 集群監控,Prometheus
— 叢集日誌記錄、Fluentd/Elastic/Kibana
主題#10:叢集更新
主題 11:實際工作、應用程式 Docker 化和啟動到叢集中
價格包含 stepik.org 上有關 Docker 和 Ansible 的課程。
→
價格:45₽
程序:
主題#1:Git 簡介
— 基本指令 git init、commit、add、diff、log、status、pull、push
— 設定本地環境:實用建議
— Git 流程、分支與標籤、合併策略
— 使用多個遠端倉庫
主題#2:使用 Git 進行團隊合作
— GitHub 流程
— 分叉、刪除、拉取請求
— 衝突、發布,再次關於 Gitflow 和其他與團隊相關的流程
主題#3:CI/CD 自動化簡介
— git 中的自動化(機器人、CI 簡介、hooks)
— 工具(bash、make、gradle)
— 工廠裝配線及其在IT中的應用
主題 #4:CI/CD:使用 Gitlab
— 建置、測試、部署
— 階段、變數、執行控制(only、when、include)
主題#5:從開發的角度使用應用程式
— 我們用 Python 寫微服務(包括測試)
— 在開發中使用 docker-compose
主題#6:基礎設施即程式碼
- IaC:基礎設施即程式碼的方法
— 以 IaC 使用 Terraform 為例
— 以 IaC 使用 Ansible 為例
——冪等性、聲明性
— 練習創作 Ansible 劇本
— 配置儲存、協作、應用自動化
主題#7:基礎設施測試
— 與 Molecule 和 Gitlab CI 的測試和持續集成
主題八:提升伺服器的自動化
— 收集影像
- PXE 和 DHCP
主題#9:基礎設施自動化
— 用於伺服器授權的基礎架構服務範例
— ChatOps(即時通訊工具與管道的整合)
主題#10:安全自動化
— 簽署 CI/CD 工件
— 漏洞掃描
主題#11:監控
— SLA、SLO、錯誤預算和 SRE 領域其他可怕術語的定義
— SRE:SLI 和 SLO 監控實踐
— SRE:使用錯誤預算的實踐
- SRE:中斷與操作負載管理(apigateway、服務網格、斷路器)
— 監控管道和開發指標
來源: www.habr.com