Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

第一天(但不是最后一天)DevOps Slurm 的第三天也是最后一天已经到来。

我们没想到能够复制 Slurm DevOps。 但出乎我们意料的是,所有演讲者都同意在二月份来到 Slurm,反馈向我们展示了如何最终确定该计划。 了解如何使强化课程更加全面和详细,以及一些主题更加实用。 因此,二月份我们将在莫斯科举办 DevOps Slurm。 详细信息将于 XNUMX 月临近时公布。 该公告肯定会出现在 Habré 上。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

6 月 XNUMX 日,Slurm 活动的第三天,四位演讲者发表了讲话。

Southbridge 的工程师/团队负责人 Vladimir Guryanov 在 Slurm DevOps 第二天的演讲受到了强化班学员的喜爱。 Vladimir 在他的工作中是 DevOps 方法的积极支持者,并尝试在任何地方实施它。

Pavel Selivanov,公认的 Slurm 明星,第一个 Kubernetes Slurm 的启发者。 学生们这样评价他:“如果他领导整个项目那就太好了。” Pavel 是一名经过认证的 Kubernetes 管理员。 他在实施 Kubernetes 方面拥有丰富的实践经验 - 团队和个人项目超过 25 个。

Tungsten Labs 首席技术官 Eduard Medvedev 在数据中心自动化中开发并实施了 ChatOps。 在他在 Slurm 上的演讲之后,许多参与者考虑在他们的公司中实施 ChatOps。 现在他成功地担任了一名安全顾问。

Booking.com 的首席开发人员 Ivan Kruglov 是本次会议的真正客座明星。 正是因为他的演讲,一些参与者报名参加了 Slurm DevOps。 在 Booking.com,他从事分布式消息传递和处理、大数据和网络堆栈、搜索等基础设施项目。 现在他的任务清单上是构建内部云和服务网格。

我们对爱德华·梅德韦杰夫和伊万·克鲁格洛夫进行了广泛的采访——准备好后我们将在《哈布雷》上发表这些采访。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

观众们一脸若有所思的样子,露出了些许疲倦。 前两天的紧张工作让我工作到了极限,我的大脑需要休息和休息。 但第三天的话题和演讲者驱散了疲劳和睡意。 特别是站点可靠性工程和 Ivan Kruglov。

即将完成 泥泞的第二天 决定将 Prometheus 的基础设施监控推迟到明天。 事实证明,密集训练太激烈了——并非所有参与者都能跟上节奏。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

因此,第三天以弗拉基米尔·古里亚诺夫的演讲开始。 他简要解释了为什么实际上需要监控。 对监控类型进行描述和分类。 我谈到了监控中的通知问题。

“如何构建健康的监控系统”和“人类可读的通知”主题很快引起了观众的共鸣。 Vladimir 以健康检查、应注意什么以及如何基于监控数据设置自动化为主题结束了他的演讲。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

为了唤醒昏昏欲睡的参与者,最大限度地激活他们的学习能力,继Vladimir Guryanov之后,Pavel Selivanov以“使用ELK记录应用程序”的主题吸引了公众的注意力。 他向 Slurm 参与者展示了我们的最佳日志记录实践并审查了 ELK 堆栈。

在第一次茶歇后,充满了交流和饼干,Slurm 参与者在观众席上就座。

古里亚诺夫、塞利万诺夫和嘌呤生物碱咖啡因的表演起到了阴险的作用。 咖啡因到达大脑的腺苷受体,取代了负责抑制过程的嘌呤核苷腺苷,这只是剥夺了 Slurm 参与者“偷懒”和“小睡”的机会。 并不是所有人都明白发生了什么。 但大家都高兴了起来。

因此,观众百分百准备好进一步学习和主动吸收知识。 还有爱德华·梅德韦杰夫的讲话。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

Eduard 谈到了 ChatOps 的基础设施自动化主题,并谈到了消息传递与管道的集成。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

Slurm 和 Slurm DevOps 第三天的压轴戏是 Booking.com 首席开发人员 Ivan Kruglov 的演讲。 Ivan 立即吸引了观众的注意力,他承认自己的演示中有 140 多张幻灯片,从而谨慎地暗示 Slurm 参与者不应为周五或周末制定计划。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

在一场激烈、漫长而深刻的演讲中,Ivan Kruglov 谈到了 DevOps 和 SRE 的话题,它们是谁以及它们之间的关系。 他谈到了“SRE 世界中的可怕术语”:SLA、SLO、错误预算等等。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

接下来是实践,甚至更多实践 - 监控 SLI 和 SLO、使用错误预算以及管理中断和操作负载(apigateway、服务网格、断路器)。 还有很多很多。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷
一位开发商的秘密祈祷。

由于 SRE 的主题非常广泛,您可以花至少几天的时间讨论其中的细微差别,因此决定在 XNUMX 月份的下一次 DevOps Slurm 上,我们将投入更多的时间来讨论 SRE 及其实际应用,因为它是最相关且最实用的。需求技术。

Sabbath, [6 сент. 2019 г., 18:25:30]:
Шикарный доклад!!
Я теперь думаю, что букинг по крутизне не уступают гуглу :)

aaa, [6 сент. 2019 г., 18:27:07]:
еще осталось UIUX подтянуть

mr. Dmitry, [6 сент. 2019 г., 18:28:47]:
Ага, сколько докладов слышал от спецов букинга - все круто, все четко, все по уму. Но пользоваться из-за их гуя крайне сложно

演讲结束后,线下和 Slurm 工作聊天中出现了无数问题:

Владимир Гурьянов, [6 сент. 2019 г., 23:24:54]:
Спрашивали про мониторинг, сколько items у нас.
Не забыл, отвечаю.
Активных: 297 432

Maksim Aleksandrov, [7 сент. 2019 г., 0:11:58]:
Спасибо . Это какое количество проверок в секунду (nvps) ?  И почему все таки prometheus ?

Владимир Гурьянов, [7 сент. 2019 г., 0:24:15]:
2.21K 
Почему prometheus? Ну, хотя бы из-за service discovery и его удобной и гибкой настройки.
У zabbix плохо все в средах, где инстансы не долго живут и часто создаются новые.
С мониторингом docker и k8s у zabbix все тоже грустно.
Но для нас, пока + у прома не столько, что бы вкладывать время и силы в переезд с zabbix.

Slurm 参与者分享了他们的印象:

Alexander B, [6 сент. 2019 г., 21:11:03]:
Спасибо за мероприятие, были "неровности", но для первого раза весьма достойно. 
Темп в некоторых практиках напрягал, это интенсив во всех смыслах этого слова ) Чтобы уместить всё и не выкидывать во второй и третий день из докладов и практик материалы по причине нехватки времени - рассмотрите возможность четырехдневного слёрма.


Roman D, [6 сент. 2019 г., 20:49:05]:
спасибо, местами было интересно. В качестве пожелания на будущее - за пару дней до мероприятия посадите пару человек с улицы и заставьте их пройти практику по вашим инструкциям, исправите ошибки и неточности.

Никита Суворов, [6 сент. 2019 г., 20:49:30 (06.09.2019, 20:50:07)]:
Если пол пожелания, тоже есть - спикерам тренироваться перед зеркалом, слух режут эээ, уууу, ыыы между словами


Max Grechnev, [6 сент. 2019 г., 19:42:57]:
Спасибо! Курс получился отличный! Финал вообще огонь)

Smith Wesson, [6 сент. 2019 г., 19:58:11]:
Спасибо за курс! Вы лучшие!

Igor Averin, [6 сент. 2019 г., 19:58:12]:
Согласен! Было оч здорово! Спасибо организаторам!

会议结束后,我们要求与会者以 Google 文档的形式提供反馈。 结果令我们高兴并受到启发。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷
Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷
Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及开发商的秘密祈祷

感谢所有与我们在一起的人——无论是线下、Selectel 会议室还是线上。 非常感谢《哈布尔》的读者。 ”Slurm给你翅膀!“(和)

来源: habr.com

添加评论