Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

ʻO ke kolu a me ka lā hope o ka mua, akā ʻaʻole ka hope, ua hiki mai ʻo DevOps Slurm.

ʻAʻole mākou i manaʻo e hiki ke hana hou iā Slurm DevOps. Akā ʻaʻole i manaʻo ʻia no mākou, ua ʻae nā mea haʻiʻōlelo a pau e hele mai i Slurm i Pepeluali, a ua hōʻike mai nā manaʻo iā mākou pehea e hoʻopau ai i ka papahana. Loaʻa ka hoʻomaopopo ʻana i ka hana ʻana i ka papahana koʻikoʻi i ʻoi aku ka holoʻokoʻa a me ka kikoʻī, a ʻoi aku ka pono o kekahi mau kumuhana. No laila ma Pepeluali e hoʻopaʻa mākou i kahi DevOps Slurm ma Moscow. Loaʻa nā kikoʻī ma kahi kokoke i Dekemaba. E ʻike ʻia ka hoʻolaha ma Habré.

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

Ma ka lā 6 o Kepakemapa, ʻo ke kolu o ka lā Slurm, ʻehā mau mea haʻiʻōlelo.

ʻO Vladimir Guryanov, ʻenehana / alakaʻi kime ma Southbridge, kāna ʻōlelo ma ka lā ʻelua o Slurm DevOps i makemake nui ʻia e ka poʻe i komo i ka intensive. He kākoʻo ikaika ʻo Vladimir i ke ala DevOps i kāna hana a hoʻāʻo e hoʻokō i nā wahi āpau.

ʻO Pavel Selivanov, he hōkū Slurm i ʻike ʻia, ka mea hoʻoikaika o ka Kubernetes Slurm mua. Ua kākau nā haumāna e pili ana iā ia "he mea maikaʻi ke alakaʻi ʻo ia i ka papahana holoʻokoʻa." He Luna Hoʻoponopono Kubernetes ʻo Pavel. Loaʻa iā ia ka ʻike kūpono i ka hoʻokō ʻana i nā Kubernetes - ʻoi aku ma mua o 25 mau papahana i loko o kahi hui a me kēlā me kēia.

ʻO Eduard Medvedev, CTO ma Tungsten Labs, hoʻomohala a hoʻokō i nā ChatOps i ka automation center data. Ma hope o kāna kamaʻilio ʻana ma Slurm, manaʻo nui nā mea komo e hoʻokō i nā ChatOps i kā lākou hui. I kēia manawa, hana maikaʻi ʻo ia ma ke ʻano he kūkākūkā palekana.

ʻO Ivan Kruglov, Luna Hoʻomohala ma Booking.com, he hōkū malihini maoli o ka ʻaha kūkā. No kāna kamaʻilio ʻana i hoʻopaʻa inoa ai kekahi mau mea komo no Slurm DevOps. Ma Booking.com ua hana ʻo ia ma nā papahana ʻoihana e like me ka hāʻawi ʻana i ka leka a me ka hoʻoili ʻana, BigData a me ka pūnaewele-stack, huli. I kēia manawa ma kāna papa inoa o nā hana ke kūkulu nei i kahi ao kūloko a me Service Mesh.

Ua hana mākou i nā nīnauele nui me Eduard Medvedev lāua ʻo Ivan Kruglov - e paʻi mākou iā lākou ma Habré ke mākaukau.

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

ʻO ke anaina, me ko lākou helehelena noʻonoʻo, ua hōʻike iki i ka luhi. ʻO nā lā koʻikoʻi ʻelua i hala ua koi iaʻu e hana i ka palena, pono koʻu mau poʻo i ka hoʻomaha a me nā lā hoʻomaha. Akā ʻo nā kumuhana a me nā mea haʻiʻōlelo o ke kolu o ka lā i hoʻopuehu i ka luhi a me ka hiamoe. ʻOi aku ka Site Reliability Engineering a me Ivan Kruglov.

I ka pau ana ʻelua lā o Slurm ua hoʻoholo ʻia e hoʻopanee i ka nānā ʻana i nā ʻoihana mai Prometheus a i ka lā ʻapōpō. Ua ʻoi aku ka ikaika o ka ikaika - ʻaʻole hiki i nā poʻe āpau ke hoʻomau i ka wikiwiki.

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

A no laila ua hoʻomaka ke kolu o ka lā me kahi haʻiʻōlelo a Vladimir Guryanov. Ua wehewehe pōkole ʻo ia i ke kumu e pono ai ka nānā ʻana. Hōʻike a hoʻokaʻawale ʻia nā ʻano o ka nānā ʻana. Ua hoʻopā wau i ka pilikia o ka hoʻolaha ʻana i ka nānā ʻana.

ʻO nā kumuhana "Pehea e kūkulu ai i kahi ʻōnaehana kiaʻi olakino" a me "Nā hoʻolaha hiki ke heluhelu ʻia e ke kanaka" wikiwiki loa i ka lehulehu. Ua hoʻopau ʻo Vladimir i kāna hōʻike me ke kumuhana o Health Check, he aha kāu e hoʻolohe ai a pehea e hoʻonohonoho ai i ka automation e pili ana i ka ʻikepili nānā.

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

I mea e hoʻoluliluli ai i ka poʻe i komo i ka hiamoe a hoʻoikaika i ko lākou hiki ke aʻo i ka nui, ma hope o Vladimir Guryanov, ua hopu ʻo Pavel Selivanov i ka manaʻo o ka lehulehu me ke kumuhana "Logging an application with ELK". Ua hōʻike ʻo ia i nā poʻe Slurm i kā mākou mau hana logging maikaʻi loa a nānā i ka waihona ELK.

Ma hope o ka hoʻomaha kope mua, piha i ka kamaʻilio a me nā kuki, ua noho nā poʻe Slurm i ko lākou mau noho i ka lehulehu.

ʻO nā hana a Guryanov, Selivanov a me ka purine alkaloid caffeine i hana i kā lākou hana insidious. Ua hōʻea ka caffeine i nā adenosine receptors o ka lolo, e hoʻololi ana i laila i ka purine nucleoside adenosine, nona ke kuleana no nā kaʻina hana inhibition - ka mea i hoʻonele wale i ka poʻe Slurm i ka manawa e "palaualelo" a "e hiamoe." ʻAʻole maopopo ka poʻe a pau i ka mea i hana ʻia. Akā, hauʻoli nā mea a pau.

No laila, ua mākaukau ka poʻe anaina no ke aʻo hou ʻana a me ke komo ʻana i ka ʻike. A i ka ʻōlelo a Eduard Medvedev.

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

Ua ʻōlelo ʻo Eduard i ke kumuhana o ka automation infrastructure me ChatOps a kamaʻilio e pili ana i ka hoʻohui ʻana o nā ʻelele me nā pipeline.

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

ʻO ka hopena o ke kolu o ka lā o Slurm a me Slurm DevOps ma ka laulā, ʻo ia ka hōʻike ʻana e Ivan Kruglov, Principal Developer ma Booking.com. Ua hopu koke ʻo Ivan i ka manaʻo o ka lehulehu, me ka ʻae ʻana ua ʻoi aku ma mua o 140 mau kiʻi paheʻe i kāna hōʻikeʻike, no laila ke kuhikuhi pono nei ʻaʻole pono nā poʻe Slurm e hana i nā hoʻolālā no ka Pōʻalima ponoʻī a no ka hopena pule.

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

Ma kahi ʻōlelo koʻikoʻi, lōʻihi a hohonu, ua hoʻopā ʻo Ivan Kruglov i ke kumuhana o DevOps a me SRE, ʻo wai lākou a pehea e pili ai kekahi i kekahi. Ua kamaʻilio ʻo ia e pili ana i "nā huaʻōlelo weliweli mai ka honua o SRE": SLA, SLO, Error Budget a me nā mea ʻē aʻe.

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

ʻO ka hoʻomaʻamaʻa a me ka hoʻomaʻamaʻa hou aʻe - ka nānā ʻana iā SLI a me SLO, me ka hoʻohana ʻana i ka Error Budget a me ka hoʻokele ʻana i nā keakea a me ka ukana hana (apigateway, service mesh, circuit breakers). A nui loa aku.

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala
Ka pule huna a ka mea hoʻomohala.

No ka mea he ākea loa ke kumuhana o SRE a hiki iā ʻoe ke kamaʻilio e pili ana i nā nuances no ka liʻiliʻi o kekahi mau lā, ua hoʻoholo ʻia ma Pepeluali i ka DevOps Slurm e hiki mai ana e hāʻawi mākou i ka manawa hou aku iā SRE a me kāna noi kūpono, ʻo ia ka mea kūpono loa a ʻenehana noiʻi.

Sabbath, [6 сент. 2019 г., 18:25:30]:
Шикарный доклад!!
Я теперь думаю, что букинг по крутизне не уступают гуглу :)

aaa, [6 сент. 2019 г., 18:27:07]:
еще осталось UIUX подтянуть

mr. Dmitry, [6 сент. 2019 г., 18:28:47]:
Ага, сколько докладов слышал от спецов букинга - все круто, все четко, все по уму. Но пользоваться из-за их гуя крайне сложно

Ma hope o nā haʻiʻōlelo, ua hiki mai ka huli o nā nīnau he nui, ma waho a ma ke kamaʻilio hana Slurm:

Владимир Гурьянов, [6 сент. 2019 г., 23:24:54]:
Спрашивали про мониторинг, сколько items у нас.
Не забыл, отвечаю.
Активных: 297 432

Maksim Aleksandrov, [7 сент. 2019 г., 0:11:58]:
Спасибо . Это какое количество проверок в секунду (nvps) ?  И почему все таки prometheus ?

Владимир Гурьянов, [7 сент. 2019 г., 0:24:15]:
2.21K 
Почему prometheus? Ну, хотя бы из-за service discovery и его удобной и гибкой настройки.
У zabbix плохо все в средах, где инстансы не долго живут и часто создаются новые.
С мониторингом docker и k8s у zabbix все тоже грустно.
Но для нас, пока + у прома не столько, что бы вкладывать время и силы в переезд с zabbix.

Ua haʻi ka poʻe hui Slurm i kā lākou manaʻo:

Alexander B, [6 сент. 2019 г., 21:11:03]:
Спасибо за мероприятие, были "неровности", но для первого раза весьма достойно. 
Темп в некоторых практиках напрягал, это интенсив во всех смыслах этого слова ) Чтобы уместить всё и не выкидывать во второй и третий день из докладов и практик материалы по причине нехватки времени - рассмотрите возможность четырехдневного слёрма.


Roman D, [6 сент. 2019 г., 20:49:05]:
спасибо, местами было интересно. В качестве пожелания на будущее - за пару дней до мероприятия посадите пару человек с улицы и заставьте их пройти практику по вашим инструкциям, исправите ошибки и неточности.

Никита Суворов, [6 сент. 2019 г., 20:49:30 (06.09.2019, 20:50:07)]:
Если пол пожелания, тоже есть - спикерам тренироваться перед зеркалом, слух режут эээ, уууу, ыыы между словами


Max Grechnev, [6 сент. 2019 г., 19:42:57]:
Спасибо! Курс получился отличный! Финал вообще огонь)

Smith Wesson, [6 сент. 2019 г., 19:58:11]:
Спасибо за курс! Вы лучшие!

Igor Averin, [6 сент. 2019 г., 19:58:12]:
Согласен! Было оч здорово! Спасибо организаторам!

Ma hope o ka ʻaha kūkā, ua noi mākou i nā haumāna e hāʻawi i nā manaʻo ma kahi palapala Google Docs. Ua hauʻoli a hoʻoulu ʻia nā hopena iā mākou.

Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala
Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala
Slurm DevOps. 3 lā. ELK, ChatOps, SRE. A me ka pule huna a ka mea hoʻomohala

Mahalo i ka poʻe a pau i hui pū me mākou - ma waho, ma ka lumi hālāwai Selectel, a ma ka pūnaewele. A mahalo nui i ka poe heluhelu o Habr. "Hāʻawi ʻo Slurm iā ʻoe i nā ʻēheu!"(Me)

Source: www.habr.com

Pākuʻi i ka manaʻo hoʻopuka