Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

DevOps Slurm이 처음이지만 마지막이 아닌 세 번째이자 마지막 날이 되었습니다.

우리는 Slurm DevOps를 복제할 수 있을 것이라고는 예상하지 못했습니다. 하지만 뜻밖에도 모든 연사들이 XNUMX월에 Slurm에 오기로 동의했고, 피드백을 통해 프로그램을 마무리하는 방법을 정확히 알 수 있었습니다. 집중 프로그램을 보다 전체적이고 상세하게 만드는 방법과 일부 주제를 보다 실용적으로 만드는 방법에 대한 이해가 있습니다. 그래서 XNUMX월에는 모스크바에서 DevOps Slurm을 개최할 예정입니다. 자세한 내용은 XNUMX월이 가까워지면 확인할 수 있습니다. 이 발표는 반드시 Habré에 게재될 예정입니다.

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

Slurm 셋째 날인 6월 XNUMX일에는 네 명의 연사가 연설했습니다.

Southbridge의 엔지니어/팀장인 Vladimir Guryanov는 Slurm DevOps 둘째 날 연설에서 집중 교육 참가자들의 큰 호응을 얻었습니다. Vladimir는 자신의 작업에서 DevOps 접근 방식을 적극적으로 지지하며 이를 모든 곳에서 구현하려고 노력합니다.

첫 번째 Kubernetes Slurm의 영감을 준 Slurm 스타이자 인정받는 Pavel Selivanov입니다. 학생들은 그에 대해 “그가 프로그램 전체를 주도하면 좋을 것 같다”고 썼다. Pavel은 공인 Kubernetes 관리자입니다. 그는 팀 내에서나 개별적으로 25개 이상의 프로젝트를 통해 Kubernetes 구현에 대한 광범위한 실무 경험을 보유하고 있습니다.

Tungsten Labs의 CTO인 Eduard Medvedev는 데이터 센터 자동화에서 ChatOps를 개발하고 구현했습니다. Slurm에서 연설한 후 많은 참가자들은 회사에서 ChatOps를 구현하는 것에 대해 생각했습니다. 이제 그는 보안 컨설턴트로 성공적으로 일하고 있습니다.

Booking.com의 수석 개발자인 Ivan Kruglov가 이번 컨퍼런스의 실제 게스트 스타입니다. 그의 연설을 위해 일부 참가자가 Slurm DevOps에 가입했습니다. Booking.com에서 그는 분산 메시지 전달 및 처리, 빅데이터 및 웹 스택, 검색과 같은 인프라 프로젝트에 참여했습니다. 이제 그의 작업 목록에는 내부 클라우드와 서비스 메시를 구축하는 것이 있습니다.

우리는 Eduard Medvedev 및 Ivan Kruglov와 광범위한 인터뷰를 진행했습니다. 준비가 되면 Habré에 게시할 예정입니다.

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

생각에 잠긴 모습에 관객들은 약간의 피로감을 드러냈다. 지난 이틀 동안 집중적으로 일하면서 한계까지 일해야 했고 머리에는 휴식과 휴가가 필요했습니다. 그러나 셋째 날의 주제와 연설자들은 피로와 졸음을 풀어주었습니다. 특히 사이트 안정성 엔지니어링 및 Ivan Kruglov.

완성을 향하여 슬럼 둘째날 Prometheus의 인프라 모니터링을 내일로 연기하기로 결정했습니다. 집중은 너무 강렬한 것으로 판명되었습니다. 모든 참가자가 속도를 따라갈 수는 없었습니다.

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

따라서 셋째 날은 Vladimir Guryanov의 연설로 시작되었습니다. 모니터링이 실제로 필요한 이유를 간략하게 설명했다. 모니터링 유형을 설명하고 분류했습니다. 모니터링 중 알림 문제를 다루었습니다.

"건강한 모니터링 시스템을 구축하는 방법"과 "사람이 읽을 수 있는 알림"이라는 주제는 청중의 공감을 매우 빠르게 불러일으켰습니다. Vladimir는 상태 점검, 주의해야 할 사항, 모니터링 데이터를 기반으로 자동화를 설정하는 방법을 주제로 프레젠테이션을 마무리했습니다.

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

졸린 참가자들을 깨우고 그들의 학습 능력을 최대한 활성화시키기 위해 Vladimir Guryanov에 이어 Pavel Selivanov는 "ELK로 애플리케이션 기록"이라는 주제로 대중의 관심을 끌었습니다. 그는 Slurm 참가자들에게 최고의 로깅 관행을 보여주고 ELK 스택을 검토했습니다.

소통과 쿠키로 가득한 첫 번째 커피 브레이크를 마친 후 Slurm 참가자들은 청중석에 자리를 잡았습니다.

Guryanov, Selivanov 및 퓨린 알칼로이드 카페인의 공연은 교활한 작업을 수행했습니다. 카페인은 뇌의 아데노신 수용체에 도달하여 억제 과정을 담당하는 퓨린 뉴클레오시드 아데노신을 대체했습니다. 이는 단순히 Slurm 참가자가 "게으르거나" "낮잠을 잘 수 있는" 기회를 박탈한 것입니다. 모든 사람이 무슨 일이 일어났는지 이해하지 못했습니다. 그러나 모두가 환호했습니다.

따라서 청중은 추가 학습과 지식의 적극적인 흡수에 XNUMX% 준비가 되어 있었습니다. 그리고 Eduard Medvedev의 연설에도.

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

Eduard는 ChatOps를 통한 인프라 자동화 주제에 대해 이야기하고 메신저와 파이프라인의 통합에 대해 이야기했습니다.

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

Slurm 및 Slurm DevOps 전반의 세 번째 날의 마지막은 Booking.com의 수석 개발자인 Ivan Kruglov의 프레젠테이션이었습니다. Ivan은 자신의 프레젠테이션에 140개 이상의 슬라이드가 있음을 인정하면서 즉시 청중의 관심을 끌었습니다. 이로써 Slurm 참가자들은 금요일이나 주말에 계획을 세워서는 안 된다는 점을 조심스럽게 암시했습니다.

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

강렬하고 길고 깊은 연설에서 Ivan Kruglov는 DevOps와 SRE가 누구인지, 그리고 서로 어떻게 관련되어 있는지 주제를 다루었습니다. 그는 "SRE 세계의 무서운 용어"(SLA, SLO, Error Budget 등)에 대해 이야기했습니다.

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

다음에는 SLI 및 SLO 모니터링, 오류 예산 사용, 인터럽트 및 운영 로드 관리(apigateway, 서비스 메시, 회로 차단기)에 대한 연습과 더 많은 연습이 이어졌습니다. 그리고 훨씬 더.

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도
개발자의 은밀한 기도.

SRE의 주제는 매우 광범위하고 최소한 며칠 동안 미묘한 차이에 대해 이야기할 수 있기 때문에 XNUMX월에 열리는 다음 DevOps Slurm에서는 가장 관련성이 높고 SRE의 실제 적용에 더 많은 시간을 할애하기로 결정했습니다. 수요가 많은 기술.

Sabbath, [6 сент. 2019 г., 18:25:30]:
Шикарный доклад!!
Я теперь думаю, что букинг по крутизне не уступают гуглу :)

aaa, [6 сент. 2019 г., 18:27:07]:
еще осталось UIUX подтянуть

mr. Dmitry, [6 сент. 2019 г., 18:28:47]:
Ага, сколько докладов слышал от спецов букинга - все круто, все четко, все по уму. Но пользоваться из-за их гуя крайне сложно

연설이 끝난 후 오프라인과 Slurm 작업 채팅 모두에서 수많은 질문이 이어졌습니다.

Владимир Гурьянов, [6 сент. 2019 г., 23:24:54]:
Спрашивали про мониторинг, сколько items у нас.
Не забыл, отвечаю.
Активных: 297 432

Maksim Aleksandrov, [7 сент. 2019 г., 0:11:58]:
Спасибо . Это какое количество проверок в секунду (nvps) ?  И почему все таки prometheus ?

Владимир Гурьянов, [7 сент. 2019 г., 0:24:15]:
2.21K 
Почему prometheus? Ну, хотя бы из-за service discovery и его удобной и гибкой настройки.
У zabbix плохо все в средах, где инстансы не долго живут и часто создаются новые.
С мониторингом docker и k8s у zabbix все тоже грустно.
Но для нас, пока + у прома не столько, что бы вкладывать время и силы в переезд с zabbix.

Slurm 참가자들은 소감을 공유했습니다.

Alexander B, [6 сент. 2019 г., 21:11:03]:
Спасибо за мероприятие, были "неровности", но для первого раза весьма достойно. 
Темп в некоторых практиках напрягал, это интенсив во всех смыслах этого слова ) Чтобы уместить всё и не выкидывать во второй и третий день из докладов и практик материалы по причине нехватки времени - рассмотрите возможность четырехдневного слёрма.


Roman D, [6 сент. 2019 г., 20:49:05]:
спасибо, местами было интересно. В качестве пожелания на будущее - за пару дней до мероприятия посадите пару человек с улицы и заставьте их пройти практику по вашим инструкциям, исправите ошибки и неточности.

Никита Суворов, [6 сент. 2019 г., 20:49:30 (06.09.2019, 20:50:07)]:
Если пол пожелания, тоже есть - спикерам тренироваться перед зеркалом, слух режут эээ, уууу, ыыы между словами


Max Grechnev, [6 сент. 2019 г., 19:42:57]:
Спасибо! Курс получился отличный! Финал вообще огонь)

Smith Wesson, [6 сент. 2019 г., 19:58:11]:
Спасибо за курс! Вы лучшие!

Igor Averin, [6 сент. 2019 г., 19:58:12]:
Согласен! Было оч здорово! Спасибо организаторам!

컨퍼런스가 끝난 후 우리는 참가자들에게 Google Docs 양식으로 피드백을 제공하도록 요청했습니다. 그 결과는 우리를 기쁘게 하고 영감을 주었습니다.

Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도
Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도
Slurm DevOps. 3일째. ELK, ChatOps, SRE. 그리고 개발자의 은밀한 기도

오프라인, Selectel 회의실, 온라인에서 함께해주신 모든 분들께 감사드립니다. 그리고 하브르 독자 여러분께 진심으로 감사드립니다. "Slurm이 당신에게 날개를 선사합니다!"(와 함께)

출처 : habr.com

코멘트를 추가