Slurm SRE - 學習確保用戶幸福

Slurm SRE - 學習確保用戶幸福

Slurm SRE 於 3 月 XNUMX 日在莫斯科啟動。

這是我們擺脫「跟著老師重複」計畫的第一個密集課程。您將在 SRE 專案中找到工作,盡可能接近戰鬥條件。

您將獲得一個成熟的工作項目,並即時使用它。典型的 SRE 任務等著您:使用不熟悉的程式碼、同步分散式系統的問題、與同事溝通的困難。

您會發現來自現實生活的重要係統故障。 (時不時聽到演講者說:「各位同事,很抱歉,這兩天我不能參加會議,但是我們的專案出現了一個很好的案例」)。

鑑於我們培訓公司的每一秒都在損失利潤,事件將會迅速發展。

我們將把參與者分成小組。每個團隊都會有一位導師,也是課程發言人。每個團隊負責自己的後端。隨著事件的發展,您將需要組織團隊的工作並與其他團隊互動。我們依照分數來比賽:評審會扣分和加分,讓隊伍看到自己的動作是否充分、有效。最後我們將宣布獲勝者。

每次事件發生後,我們都會進行匯報,以確定並修正流程中的系統問題。導師將確保遵守事後剖析的無可指責文化。在我們領域,無可指責的方法還沒有廣泛傳播,但這卻是實施 SRE 和 DevOps 的關鍵之一。

我們期望在三天內實現全球範式轉移:教你像 SRE 工程師一樣思考,像 SRE 工程師一樣看待專案。

要參與,您需要筆記型電腦、耳機和 Kubernetes 的基本知識。如果沒有最後一點,可以在剩餘時間內參加線上課程 Slurm Kubernetes.

註冊 這裡.

來源: www.habr.com

添加評論