Slurm SRE - 学习确保用户幸福

Slurm SRE - 学习确保用户幸福

Slurm SRE 于 3 月 XNUMX 日在莫斯科启动。

这是我们摆脱“跟着老师重复”计划的第一个强化课程。 您将在 SRE 项目中找到工作,尽可能接近战斗条件。

您将获得一个成熟的工作项目,并实时使用它。 典型的 SRE 任务等待着您:使用不熟悉的代码、同步分布式系统的问题、与同事沟通的困难。

您会发现来自现实生活的重要系统故障。 (时不时听到演讲者说:“各位同事,很抱歉,这两天我不能参加会议,但是我们的项目出现了一个很好的案例”)。

鉴于我们培训公司的每一秒都在损失利润,事件将会迅速发展。

我们将把参与者分成小组。 每个团队都会有一名导师,也是一名课程发言人。 每个团队负责自己的后端。 随着事件的发展,您将需要组织团队的工作并与其他团队互动。 我们按照分数进行比赛:评委会进行扣分和加分,让队伍看到自己的动作是否充分、有效。 最后我们将宣布获胜者。

每次事件发生后,我们都会进行汇报,以确定并纠正流程中的系统问题。 导师将确保遵守事后剖析的无可指责文化。 在我们领域,无可指责的方法还没有广泛传播,但这却是实施 SRE 和 DevOps 的关键之一。

我们期望在三天内实现全球范式转变:教你像 SRE 工程师一样思考,像 SRE 工程师一样看待项目。

要参与,您需要笔记本电脑、耳机和 Kubernetes 的基本知识。 如果没有最后一点,可以在剩余时间内参加在线课程 Slurm Kubernetes.

注册 这里.

来源: habr.com

添加评论