Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

Ha arribat el tercer i últim dia del primer, però no l'últim, DevOps Slurm.

No esperàvem poder replicar Slurm DevOps. Però inesperadament per a nosaltres, tots els ponents van acceptar venir a Slurm al febrer, i els comentaris ens van mostrar exactament com finalitzar el programa. Hi ha una comprensió de com fer que el programa intensiu sigui més holístic i detallat, i alguns temes més pràctics. Així que al febrer farem un DevOps Slurm a Moscou. Els detalls estaran disponibles més a prop de desembre. L'anunci apareixerà definitivament a Habré.

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

El 6 de setembre, tercer dia de Slurm, van intervenir quatre ponents.

Vladimir Guryanov, enginyer/cap d'equip de Southbridge, el discurs del qual el segon dia de Slurm DevOps va agradar molt als participants de l'intensiu. Vladimir és un defensor actiu de l'enfocament DevOps en el seu treball i intenta implementar-lo a tot arreu.

Pavel Selivanov, una reconeguda estrella de Slurm, l'inspirador del primer Slurm de Kubernetes. Els estudiants van escriure sobre ell que "seria genial si dirigia tot el programa". Pavel és un administrador certificat de Kubernetes. Té una àmplia experiència pràctica en la implementació de Kubernetes: més de 25 projectes en equip i individualment.

Eduard Medvedev, CTO de Tungsten Labs, va desenvolupar i implementar ChatOps en l'automatització del centre de dades. Després de la seva intervenció a Slurm, molts participants van pensar a implementar ChatOps a les seves empreses. Ara treballa amb èxit com a consultor de seguretat.

Ivan Kruglov, desenvolupador principal de Booking.com, és un autèntic convidat estrella de la conferència. Va ser per al seu discurs que alguns participants es van apuntar a Slurm DevOps. A Booking.com va treballar en projectes d'infraestructura com el lliurament i processament de missatges distribuïts, BigData i web-stack, cerca. Ara a la seva llista de tasques hi ha la creació d'un núvol intern i una malla de servei.

Hem realitzat entrevistes exhaustives amb Eduard Medvedev i Ivan Kruglov; les publicarem a Habré quan estiguin a punt.

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

El públic, amb el seu aspecte pensatiu, va mostrar un lleuger cansament. Els dos dies intensius anteriors m'han obligat a treballar al límit, el meu cap necessitava descans i dies de descans. Però els temes i els ponents del tercer dia van dispersar el cansament i la somnolència. Especialment l'enginyeria de fiabilitat del lloc i Ivan Kruglov.

Cap a la finalització segon dia de Slurm es va decidir ajornar el seguiment de la infraestructura des de Prometeu per demà. L'intensiu va resultar massa intens: no tots els participants van poder mantenir el ritme.

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

I, per tant, el tercer dia va començar amb un discurs de Vladimir Guryanov. Va explicar breument per què és realment necessari un seguiment. Tipus de seguiment descrits i classificats. Vaig tocar el tema de les notificacions en el seguiment.

Els temes "Com construir un sistema de monitoratge saludable" i "Notificacions llegibles pels humans" van ressonar molt ràpidament entre l'audiència. Vladimir va concloure la seva presentació amb el tema de la comprovació de la salut, a què s'ha de prestar atenció i com configurar l'automatització a partir de les dades de seguiment.

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

Per tal de sacsejar els participants adormits i activar al màxim les seves capacitats d'aprenentatge, seguint Vladimir Guryanov, Pavel Selivanov va captar l'atenció del públic amb el tema "Registrar una aplicació amb ELK". Va mostrar als participants de Slurm les nostres millors pràctiques de registre i va revisar la pila ELK.

Després de la primera pausa cafè, plena de comunicació i galetes, els participants de Slurm van prendre el seu seient entre el públic.

Les actuacions de Guryanov, Selivanov i l'alcaloide purina cafeïna van fer la seva feina insidiosa. La cafeïna va arribar als receptors d'adenosina del cervell, substituint-hi el nucleòsid purínic adenosina, responsable dels processos d'inhibició, que simplement van privar els participants de Slurm de l'oportunitat de "ser mandrós" i "fer una migdiada". No tothom va entendre què va passar. Però tothom es va animar.

Així, el públic estava cent per cent preparat per a un aprenentatge posterior i l'absorció activa del coneixement. I al discurs d'Eduard Medvedev.

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

Eduard va parlar del tema de l'automatització d'infraestructures amb ChatOps i va parlar de la integració de missatgers amb pipelines.

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

El final del tercer dia de Slurm i Slurm DevOps en general va ser la presentació d'Ivan Kruglov, desenvolupador principal de Booking.com. Ivan va captar immediatament l'atenció de l'audiència i va admetre que tenia més de 140 diapositives a la seva presentació, i va donar a entendre que els participants de Slurm no haurien de fer plans ni per al divendres ni pel cap de setmana.

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

En un discurs intens, llarg i profund, Ivan Kruglov va tocar el tema de DevOps i SRE, qui són i com es relacionen entre ells. Va parlar de "termes aterridors del món de l'SRE": SLA, SLO, Error Budget i alguns altres.

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

A continuació va venir la pràctica i encara més pràctica: supervisar SLI i SLO, utilitzar el pressupost d'errors i gestionar les interrupcions i la càrrega operativa (apigateway, malla de servei, disjuntors). I molt, molt més.

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador
L'oració secreta d'un desenvolupador.

Atès que el tema de l'SRE és extremadament ampli i es pot parlar dels matisos almenys durant uns quants dies, es va decidir que al febrer a la propera DevOps Slurm dedicarem encara més temps a l'SRE i la seva aplicació pràctica, com a la més rellevant i tecnologia en demanda.

Sabbath, [6 сент. 2019 г., 18:25:30]:
Шикарный доклад!!
Я теперь думаю, что букинг по крутизне не уступают гуглу :)

aaa, [6 сент. 2019 г., 18:27:07]:
еще осталось UIUX подтянуть

mr. Dmitry, [6 сент. 2019 г., 18:28:47]:
Ага, сколько докладов слышал от спецов букинга - все круто, все четко, все по уму. Но пользоваться из-за их гуя крайне сложно

Després de les intervencions, va arribar el torn de nombroses preguntes, tant fora de línia com al xat de treball de Slurm:

Владимир Гурьянов, [6 сент. 2019 г., 23:24:54]:
Спрашивали про мониторинг, сколько items у нас.
Не забыл, отвечаю.
Активных: 297 432

Maksim Aleksandrov, [7 сент. 2019 г., 0:11:58]:
Спасибо . Это какое количество проверок в секунду (nvps) ?  И почему все таки prometheus ?

Владимир Гурьянов, [7 сент. 2019 г., 0:24:15]:
2.21K 
Почему prometheus? Ну, хотя бы из-за service discovery и его удобной и гибкой настройки.
У zabbix плохо все в средах, где инстансы не долго живут и часто создаются новые.
С мониторингом docker и k8s у zabbix все тоже грустно.
Но для нас, пока + у прома не столько, что бы вкладывать время и силы в переезд с zabbix.

Els participants de Slurm van compartir les seves impressions:

Alexander B, [6 сент. 2019 г., 21:11:03]:
Спасибо за мероприятие, были "неровности", но для первого раза весьма достойно. 
Темп в некоторых практиках напрягал, это интенсив во всех смыслах этого слова ) Чтобы уместить всё и не выкидывать во второй и третий день из докладов и практик материалы по причине нехватки времени - рассмотрите возможность четырехдневного слёрма.


Roman D, [6 сент. 2019 г., 20:49:05]:
спасибо, местами было интересно. В качестве пожелания на будущее - за пару дней до мероприятия посадите пару человек с улицы и заставьте их пройти практику по вашим инструкциям, исправите ошибки и неточности.

Никита Суворов, [6 сент. 2019 г., 20:49:30 (06.09.2019, 20:50:07)]:
Если пол пожелания, тоже есть - спикерам тренироваться перед зеркалом, слух режут эээ, уууу, ыыы между словами


Max Grechnev, [6 сент. 2019 г., 19:42:57]:
Спасибо! Курс получился отличный! Финал вообще огонь)

Smith Wesson, [6 сент. 2019 г., 19:58:11]:
Спасибо за курс! Вы лучшие!

Igor Averin, [6 сент. 2019 г., 19:58:12]:
Согласен! Было оч здорово! Спасибо организаторам!

Després de la conferència, vam demanar als participants que ens fessin comentaris en un formulari de Google Docs. Els resultats ens van agradar i inspirar.

Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador
Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador
Slurm DevOps. 3r dia. ELK, ChatOps, SRE. I l'oració secreta del desenvolupador

Gràcies a tots els que van estar amb nosaltres: fora de línia, a la sala de conferències de Selectel i en línia. I moltes gràcies als lectors d'Habr. "Slurm et dóna ales!" (Amb)

Font: www.habr.com

Afegeix comentari