Slurm SRE. Таҷрибаи пурра бо коршиносони Booking.com ва Google.com

Коллективи мо тачрибахоро дуст медорад. Ҳар як Slurm такрори статикии пештара нест, балки инъикоси таҷриба ва гузариш аз хуб ба беҳтар аст. Аммо бо Slurm SRE мо карор додем, ки формати тамоман навро ба кор барем — ба иштирокчиён шароити харчи бештар ба «мубориза» наздик дихем.

Агар мо дар давоми курси пуршиддат кореро, ки кардем, мухтасар баён кунем: «Мо месозем, месозем, таъмир мекунем,
мехонем». SRE танҳо дар назария арзиши кам дорад - танҳо амалия, ҳалли воқеӣ, мушкилоти воқеӣ.

Иштирокчиёнро ба дастаҳо тақсим карданд, то рӯҳияи пурқуввати рақобатӣ ба касе имкон надиҳад, ки ба хоб равад ё дар iPhone, аз рӯи мисоли Дмитрий Анатольевич "Паррандаҳои хашмгин" -ро оғоз кунад.

Мушкилот, хатоҳо, хатогиҳо ва вазифаҳо аз ҷониби чор мураббиён ба иштирокчиён пешниҳод карда шуданд. Иван Круглов, таҳиягари асосии Booking.com (Нидерландия). Бен Тайлер, таҳиягари асосии Booking.com (ИМА). Эдуард Медведев, директори директори Labs Tungsten (Олмон). Евгений Варавва, таҳиягари генералии Google (Сан-Франсиско).

Гузашта аз ин, иштирокчиён ба дастаҳо тақсим шуда, бо ҳам рақобат мекунанд. Ҷолиб?

Slurm SRE. Таҷрибаи пурра бо коршиносони Booking.com ва Google.com
Иван, Бен, Эдуард ва Евгений пеш аз огози мусобика ба иштирокку-нандагони камбагал СЛурм СРЭ бо чашмони неки ленинй менигаранд.

Пас вазифа:

Мо аз они худем, дунёи нав месозем...

Вебсайти агрегатори чиптаҳои филм мавҷуд аст. Ҳодисаҳо аз ҷониби мураббиён дар сенарияи қаблан коркардшуда ихтироъ карда мешаванд (гарчанде ки ҳеҷ кас импровизатсияи махсусан мураккаб ва маккоронаро истисно намекунад), иҷрои сайт бо ченакҳои гуногун тавсиф карда мешавад. Мушкилотҳо метавонанд хеле гуногун бошанд: чиптаҳои театри Мулен Руж ба базаи маълумот бор карда намешаванд; плакатхои фильму спектакльхо ба база дар давоми зиёда аз 10 сония бор карда мешаванд; тавсифи филми алоҳида ях мекунад; 0,1% фармоишҳо аллакай захира карда шудаанд; Баъзан системаи коркарди пардохт барои як ё ду дақиқа кор мекунад. Ва бисёр, бисёр ва бисёр чизҳои ногувор, ки метавонанд ба як иштирокчии Slurm SRE дар кори воқеии худ дучор шаванд.

Slurm SRE. Таҷрибаи пурра бо коршиносони Booking.com ва Google.com
Мо омодаем, ки ҳама чизро ҳал кунем ... ва ҳама.

Вебсайти деринаи мо аз якчанд хидматрасонии хурд иборат аст. Вазифаи он ҷамъоварӣ кардани маълумот дар бораи намоишҳо, нархҳо ва ҷойҳои дастрас аз тамоми кинотеатрҳо мебошад; он эълонҳои филмҳоро нишон медиҳад, ба шумо имкон медиҳад, ки кинотеатр, намоиш, толор ва ҷой интихоб кунед, брон кунед ва барои чиптаҳо пардохт кунед. Умуман, ҳама чизеро, ки бинанда танҳо орзу карда метавонад. Аммо корбар ҳатто гумон намекунад, ки дар дохили он чӣ муборизаи бузург барои субот ва дастрасии сайт идома дорад.

Барои сайти пуршиддат, мо нишондиҳандаҳои SLO, SLI, SLA тавлид кардем, меъморӣ ва инфрасохторро таҳия кардем, сайтро ҷойгир кардем, мониторинг ва огоҳӣ таъсис додем. Ва мо меравем.

SLO, SLI, SLA

SLI - нишондиҳандаҳои сатҳи хизматрасонӣ. SLO ҳадафҳои сатҳи хидматрасонӣ мебошанд. SLA - созишномаҳои сатҳи хидматрасонӣ.

SLA як истилоҳи методологияи ITIL мебошад, ки созишномаи расмии байни муштарии хадамот ва таъминкунандаи онро ифода мекунад, ки тавсифи хадамот, ҳуқуқ ва ӯҳдадориҳои тарафҳо ва муҳимтар аз ҳама, сатҳи мувофиқашудаи сифатро дар бар мегирад. хизматрасонй.

SLO ҳадафи сатҳи хидматрасонӣ мебошад: арзиши мақсаднок ё диапазони арзишҳо барои сатҳи хидмате, ки аз ҷониби SLI чен карда мешавад. Қимати муқаррарӣ барои SLO "SLI ≤ Target" ё "Лимити поён ≤ SLI ≤ Лимити болоӣ" аст.

SLI нишондиҳандаи сатҳи хидматрасонӣ мебошад - ченаки бодиққат муайяншудаи миқдории як ҷанбаи сатҳи хидматрасонӣ. Барои аксари хидматҳо, калиди SLI таъхири дархост ҳисобида мешавад - барои баргардонидани посух ба дархост чӣ қадар вақт лозим аст. Дигар SLI-ҳои маъмул сатҳи хатогиҳоро дар бар мегиранд, ки аксар вақт ҳамчун як қисми ҳамаи дархостҳои гирифташуда ифода карда мешаванд ва қобилияти интиқоли система, ки одатан бо дархостҳо дар як сония чен карда мешаванд.

Аввал самолётхоро мешиканем, баъд духтарон, баъд духтарон...

Омилхои дохилй ва берунй аз дакикахои аввал СЛО-ро «вайрон кардан» шуданд. Ҳама чиз ба сари маъмурон афтод - хатогиҳои таҳиягарон, нокомии инфрасохтор, вуруди меҳмонон ва ҳамлаҳои DDoS. Ҳама чизест, ки SLO-ро бадтар мекунад.

Slurm SRE. Таҷрибаи пурра бо коршиносони Booking.com ва Google.com
"- Муҳтарам иштирокчиён, ман мешитобам, ки шуморо шод кунам, аввалин чизе, ки шумо ноком мекунед, ин... ҳама чиз аст!"

Дар баробари ин суханронӣ субот, буҷаи хатогиҳо, таҷрибаи санҷиш, идоракунии таваққуфҳо ва сарбории амалиётро баррасӣ карданд.

Мо чанговар нестем, дуредгар нестем...

Сипас иштирокчиён ба ислоҳ кардани чизҳо шурӯъ карданд - чизи асосӣ фаҳмидани он аст, ки аввал чиро гирифтан лозим аст.

Slurm SRE. Таҷрибаи пурра бо коршиносони Booking.com ва Google.com
"-Худовандо, ман ҳеҷ гоҳ надидаам, ки ин гуна, дар ин шакл ва дар чунин мавқеъ шикаста бошад!"

Инак, фалокат руй дод. Хидмати коркарди пардохт қатъ шудааст. Чӣ тавр бояд амал кард, то ки функсия дар муддати кӯтоҳтарин барқарор карда шавад?

Slurm SRE. Таҷрибаи пурра бо коршиносони Booking.com ва Google.com
Мутахассисон ба иштирокчиён бо мехру мухаббат нигох карда, боз як найранг тайёр мекунанд.

Хар як коллектив кори гурУхро барои бартараф намудани фалокат ташкил мекунад — хамкасбонро чалб мекунад, ба шахсони манфиатдор (шахсони манфиатдор) хабар медихад. Дар баробари ин, афзалиятҳо муайян карда мешаванд. Ҳамин тариқ, иштирокчиён дар шароити хеле маҳдуди вақт кор карданро дар зери фишор омӯзониданд.

Slurm SRE. Таҷрибаи пурра бо коршиносони Booking.com ва Google.com
"Чӣ даҳшат баромад?!"

Нафас гиред... ва машқро анҷом диҳед

Якҷоя бо баромадкунандагон, пас аз ҳалли ҳар як мушкилот ва муваққатан муътадил шудани сайт, гурӯҳ ҳодисаҳоро аз нуқтаи назари SRE омӯхт. Мо проблемахоро муфассал тахлил кардем — сабабхои ба амал омадан, рафти бартараф кардани онхо. Баъд аз ин, мо хам даста ба даста ва чи ба таври коллективона дар бораи минбаъд пешгирй кардани онхо карор кабул кардем: назоратро чй тавр бехтар кардан, меъмориро чй тавр окилона тагьир додан, муносибатро ба тахия ва истифода, чй тавр ислох кардани нормахо. Нотикон амалияи гузарондани паичсоларо нишон доданд.

Slurm SRE. Таҷрибаи пурра бо коршиносони Booking.com ва Google.com
«Дигар кӣ азобро мехоҳад! - Ман!"

Муваффакиятхои командахо дар тахтаи электронй катъиян ва равшан кайд карда мешуданд.

Slurm SRE. Таҷрибаи пурра бо коршиносони Booking.com ва Google.com

Барои ҷойҳои аввал - бонус аз ҷониби ҷонибҳои манфиатдор.

Slurm SRE. Таҷрибаи пурра бо коршиносони Booking.com ва Google.com

Манбаъ: will.com

Илова Эзоҳ