Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

第一天(但不是最後一天)DevOps Slurm 的第三天也是最後一天已經到來。

我們沒想到能夠複製 Slurm DevOps。 但出乎我們意料的是,所有演講者都同意在二月來到 Slurm,反饋向我們展示瞭如何最終確定該計劃。 了解如何使密集課程更加全面和詳細,以及一些主題更加實用。 因此,二月我們將在莫斯科舉辦 DevOps Slurm。 詳細資訊將於 XNUMX 月臨近時公佈。 該公告肯定會出現在 Habré 上。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

6 月 XNUMX 日,Slurm 活動的第三天,四位演講者發表了演講。

Southbridge 的工程師/團隊負責人 Vladimir Guryanov 在 Slurm DevOps 第二天的演講受到了強化班學員的喜愛。 Vladimir 在他的工作中是 DevOps 方法的積極支持者,並嘗試在任何地方實施它。

Pavel Selivanov,公認的 Slurm 明星,第一個 Kubernetes Slurm 的啟發者。 學生們這樣評價他:“如果他領導整個專案那就太好了。” Pavel 是一名經過認證的 Kubernetes 管理員。 他在實施 Kubernetes 方面擁有豐富的實務經驗 - 團隊和個人專案超過 25 個。

Tungsten Labs 技術長 Eduard Medvedev 在資料中心自動化中開發並實施了 ChatOps。 在他在 Slurm 上的演講之後,許多參與者考慮在他們的公司中實施 ChatOps。 現在他成功地擔任了一名安全顧問。

Booking.com 的首席開發人員 Ivan Kruglov 是本次會議的真正客座明星。 正是因為他的演講,一些參與者報名參加了 Slurm DevOps。 在 Booking.com,他從事分散式訊息傳遞和處理、大數據和網路堆疊、搜尋等基礎設施項目。 現在他的任務清單上是建立內部雲端和服務網格。

我們對愛德華·梅德韋傑夫和伊万·克魯格洛夫進行了廣泛的採訪——準備好後我們將在《哈布雷》上發表這些採訪。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

觀眾一臉若有所思的樣子,露出了些許疲倦。 前兩天的緊張工作讓我工作到了極限,我的大腦需要休息和休息。 但第三天的話題和演講者驅散了疲勞和睡意。 特別是站點可靠性工程和 Ivan Kruglov。

即將完成 泥濘的第二天 決定將 Prometheus 的基礎設施監控推遲到明天。 事實證明,密集訓練太激烈了——並非所有參與者都能跟上節奏。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

因此,第三天以弗拉基米爾·古里亞諾夫的演講開始。 他簡要地解釋了為什麼實際上需要監控。 對監控類型進行描述和分類。 我談到了監控中的通知問題。

「如何建立健康的監控系統」和「人類可讀的通知」主題很快就引起了觀眾的共鳴。 Vladimir 以健康檢查、應注意什麼以及如何基於監控數據設定自動化為主題結束了他的演講。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

為了喚醒昏昏欲睡的參與者,最大限度地激活他們的學習能力,繼Vladimir Guryanov之後,Pavel Selivanov以「使用ELK記錄應用程式」的主題吸引了公眾的注意。 他向 Slurm 參與者展示了我們的最佳日誌記錄實踐並審查了 ELK 堆疊。

在第一次茶歇後,充滿了交流和餅乾,Slurm 參與者在觀眾席上就座。

古里亞諾夫、塞利萬諾夫和嘌呤生物鹼咖啡因的表演扮演了一個陰險的角色。 咖啡因到達大腦的腺苷受體,取代了負責抑制過程的嘌呤核苷腺苷,這只是剝奪了 Slurm 參與者「偷懶」和「小睡」的機會。 並不是每個人都明白發生了什麼事。 但大家都振奮起來。

因此,觀眾百分之百準備好進一步學習和主動吸收知識。 還有愛德華·梅德韋傑夫的演講。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

Eduard 談到了 ChatOps 的基礎設施自動化主題,並談到了訊息傳遞與管道的整合。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

Slurm 和 Slurm DevOps 第三天的壓軸是 Booking.com 首席開發人員 Ivan Kruglov 的演講。 Ivan 立即吸引了觀眾的注意力,他承認自己的演示中有 140 多張幻燈片,從而謹慎地暗示 Slurm 參與者不應為週五或週末制定計劃。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

在一場激烈、漫長而深刻的演講中,Ivan Kruglov 談到了 DevOps 和 SRE 的話題,它們是誰以及它們之間的關係。 他談到了「SRE 世界中的可怕術語」:SLA、SLO、錯誤預算等等。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

接下來是實踐,甚至更多實踐 - 監控 SLI 和 SLO、使用錯誤預算以及管理中斷和操作負載(apigateway、服務網格、斷路器)。 還有很多很多。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱
一位開發商的秘密祈禱。

由於SRE 的主題非常廣泛,您可以花至少幾天的時間討論其中的細微差別,因此決定在XNUMX 月份的下一次DevOps Slurm 上,我們將投入更多的時間來討論SRE 及其實際應用,因為它是最相關且最實用的。需求技術。

Sabbath, [6 сент. 2019 г., 18:25:30]:
Шикарный доклад!!
Я теперь думаю, что букинг по крутизне не уступают гуглу :)

aaa, [6 сент. 2019 г., 18:27:07]:
еще осталось UIUX подтянуть

mr. Dmitry, [6 сент. 2019 г., 18:28:47]:
Ага, сколько докладов слышал от спецов букинга - все круто, все четко, все по уму. Но пользоваться из-за их гуя крайне сложно

演講結束後,線下和 Slurm 工作聊天中出現了無數問題:

Владимир Гурьянов, [6 сент. 2019 г., 23:24:54]:
Спрашивали про мониторинг, сколько items у нас.
Не забыл, отвечаю.
Активных: 297 432

Maksim Aleksandrov, [7 сент. 2019 г., 0:11:58]:
Спасибо . Это какое количество проверок в секунду (nvps) ?  И почему все таки prometheus ?

Владимир Гурьянов, [7 сент. 2019 г., 0:24:15]:
2.21K 
Почему prometheus? Ну, хотя бы из-за service discovery и его удобной и гибкой настройки.
У zabbix плохо все в средах, где инстансы не долго живут и часто создаются новые.
С мониторингом docker и k8s у zabbix все тоже грустно.
Но для нас, пока + у прома не столько, что бы вкладывать время и силы в переезд с zabbix.

Slurm 參與者分享了他們的印象:

Alexander B, [6 сент. 2019 г., 21:11:03]:
Спасибо за мероприятие, были "неровности", но для первого раза весьма достойно. 
Темп в некоторых практиках напрягал, это интенсив во всех смыслах этого слова ) Чтобы уместить всё и не выкидывать во второй и третий день из докладов и практик материалы по причине нехватки времени - рассмотрите возможность четырехдневного слёрма.


Roman D, [6 сент. 2019 г., 20:49:05]:
спасибо, местами было интересно. В качестве пожелания на будущее - за пару дней до мероприятия посадите пару человек с улицы и заставьте их пройти практику по вашим инструкциям, исправите ошибки и неточности.

Никита Суворов, [6 сент. 2019 г., 20:49:30 (06.09.2019, 20:50:07)]:
Если пол пожелания, тоже есть - спикерам тренироваться перед зеркалом, слух режут эээ, уууу, ыыы между словами


Max Grechnev, [6 сент. 2019 г., 19:42:57]:
Спасибо! Курс получился отличный! Финал вообще огонь)

Smith Wesson, [6 сент. 2019 г., 19:58:11]:
Спасибо за курс! Вы лучшие!

Igor Averin, [6 сент. 2019 г., 19:58:12]:
Согласен! Было оч здорово! Спасибо организаторам!

會議結束後,我們要求與會者以 Google 文件的形式提供回饋。 結果令我們高興並受到啟發。

Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱
Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱
Slurm DevOps。 第三天。 ELK、ChatOps、SRE。 以及開發商的秘密祈禱

感謝所有與我們在一起的人——無論是線下、Selectel 會議室還是線上。 非常感謝《哈布爾》的讀者。 」Slurm給你翅膀!」(和)

來源: www.habr.com

添加評論