Slurm:毛毛虫变成蝴蝶

Slurm:毛毛虫变成蝴蝶

  1. Slurm 确实可以让您进入 Kubernetes 主题或提高您的知识。
  2. 参与者都很高兴。 只有少数人没有学到任何新东西或没有解决他们的问题。 第一天的无条件退款(“如果你觉得Slurm不适合你,我们将退还门票全价”)只有一个人使用,证明他高估了自己的实力。
  3. 下一次 Slurm 将于九月初在圣彼得堡举行。 我们的永久赞助商 Selectel 不仅提供云展台,还提供自己的会议室。
  4. 我们正在重复基本的 Slurm(9 月 11 日至 4 日)并引入一个新计划:DevOps Slurm(6 月 XNUMX 日至 XNUMX 日)。

Slurm 是什么?它有何变化?

一年前,我们提出了开设 Kubernetes 课程的想法。 18 年 1 月,Slurm-XNUMX 举行:困难,持续的预演(当演示在舞台上完成时),有一堆日常问题。 试炼团结起来:第一次 Slurm 的参与者,就像指环王一样,仍然互相交流。

Slurm:毛毛虫变成蝴蝶
这就是 Slurm-1 的样子

在第一次 Slurm 时,举办 MegaSlurm 的想法就诞生了。 我们询问人们对哪些主题感兴趣,并于 19 月份“应参与者的要求”举办了高级课程。 事实证明这是一次有趣但一次性的活动。 到 XNUMX 年 XNUMX 月,我们已经准备好了真正的高级课程,有它自己的逻辑和内部历史。

在这一年里,Slurm 在组织上发生了变化:
— Docker 和 Anisble 从主程序中删除,并制作了单独的在线课程。
— 有组织的技术支持,帮助学生解决学习集群问题。
— 发言者现在得到了方法论上的支持。

Slurm:毛毛虫变成蝴蝶
《Slurm 4》的制作团队

参与者的反馈

另一项记录被创造:基本 Slurm 的参与者有 170 人,MegaSlurm 的参与者有 75 人。

Slurm:毛毛虫变成蝴蝶

Slurm-4
101 人中有 170 人填写了反馈表。

Kubernetes 变得清晰了吗?
41 — 我还不了解 k8s,但我知道该在哪里挖掘。
36 — 我以前不知道k8s,但现在我明白了。
23 — 我以前了解 k8s,但现在我了解得更多了。
1 - 我没有学到任何新东西。
0——我对k8s一无所知。

你觉得 Slurm 的强度如何?

16 人认为 Slurm 太简单太慢,14 人认为太难太快。 适合其余的。

你解决了你要 Slurm 遇到的问题了吗?

90 - 是的。
11 - 没有。

巨型泥浆

40 人填写了反馈表。 2 个人说这太简单而且太慢。 1 个人没有解决他要去 Mega 的问题。 其余的都还好。

Slurm 的评论 https://serveradmin.ru

演讲者评论

Slurm:毛毛虫变成蝴蝶

如果说二月份的圣彼得堡 Slurm 上大部分都是初学者,那么莫斯科 Slurm 上就有大量人尝试过 Kubernetes。 有很多高级问题让你思考。

如果在圣彼得堡他们问我们什么时候会发布我们的 kubespray 分叉,那么在莫斯科他们已经问我们为什么建议使用我们的分叉而不采用原来的 kubespray。 这已经是中老年人的批判性思维了。

练习很困难,人们犯了很多错误,这很好:你需要在学习时犯错误,而不是在战斗中犯错误。

我们经常遇到获取证书的限制、Github 下载的限制等。 这就是生活 - 我们在 Selectel 云中同时部署了大约 200 个集群。 没有人为此准备资源和限制。

Selectel 的 Slurm 公告

注册 Slurm-5
价格:25₽

程序:

主题#1:Kubernetes 简介,主要组件
— k8s 技术简介。 描述、应用、概念
— Pod、ReplicaSet、部署、服务、入口、PV、PVC、ConfigMap、Secret

主题二:集群设计、主要组件、容错、k2s网络
— 集群设计、主要组件、容错
— k8s 网络

主题 #3:Kubespray、调整和设置 Kubernetes 集群
— Kubespray,Kubernetes 集群的配置和调优

主题#4:高级 Kubernetes 抽象
- DaemonSet、StatefulSet、RBAC、Job、CronJob、Pod 调度、InitContainer

主题#5:发布服务和应用程序
— 服务发布方式概述:NodePort vs LoadBalancer vs Ingress
— 入口控制器 (Nginx):平衡传入流量
— cert-manager:自动获取SSL/TLS证书

主题#6:Helm 简介

主题#7:安装证书管理器

主题#8:Ceph:“像我一样”安装

主题#9:日志记录和监控
— 集群监控,Prometheus
— 集群日志记录、Fluentd/Elastic/Kibana

主题#10:集群更新

主题 11:实际工作、应用程序 Docker 化和启动到集群中

价格包含 stepik.org 上有关 Docker 和 Ansible 的课程。

注册 Slurm DevOps
价格:45₽

程序:

主题#1:Git 简介
— 基本命令 git init、commit、add、diff、log、status、pull、push
— 设置本地环境:实用建议
— Git 流程、分支和标签、合并策略
— 使用多个远程仓库

主题 #2:使用 Git 进行团队合作
— GitHub 流程
— 分叉、删除、拉取请求
— 冲突、发布,再次涉及与团队相关的 Gitflow 和其他流程

主题#3:CI/CD 自动化简介
— git 中的自动化(机器人、CI 简介、hooks)
— 工具(bash、make、gradle)
— 工厂装配线及其在IT中的应用

主题 #4:CI/CD:使用 Gitlab
— 构建、测试、部署
— 阶段、变量、执行控制(only、when、include)

主题#5:从开发的角度使用应用程序
— 我们用 Python 编写微服务(包括测试)
— 在开发中使用 docker-compose

主题#6:基础设施即代码
- IaC:基础设施即代码的方法
— 以 IaC 使用 Terraform 为例
— 以 IaC 使用 Ansible 为例
——幂等性、声明性
— 练习创建 Ansible 剧本
— 配置存储、协作、应用自动化

主题#7:基础设施测试
— 与 Molecule 和 Gitlab CI 的测试和持续集成

主题八:提升服务器的自动化
— 收集图像
- PXE 和 DHCP

主题#9:基础设施自动化
— 用于服务器授权的基础设施服务示例
— ChatOps(即时通讯工具与管道的集成)

主题#10:安全自动化
— 签署 CI/CD 工件
— 漏洞扫描

主题#11:监控
— SLA、SLO、错误预算和 SRE 领域其他可怕术语的定义
— SRE:SLI 和 SLO 监控实践
— SRE:使用错误预算的实践
- SRE:中断和操作负载管理(apigateway、服务网格、断路器)
— 监控管道和开发指标

来源: habr.com

添加评论