На што да размислите при спроведување на дежурства

Ефективниот автор на DevOps, Рин Даниелс, споделува стратегии што секој може да ги користи за да создаде подобри, помалку фрустрирачки и поодржливи Oncall ротации.

На што да размислите при спроведување на дежурства

Со доаѓањето на Devops, многу инженери овие денови организираат смени на еден или друг начин, што некогаш беше единствена одговорност на sysadmins или оперативните инженери. Да се ​​биде дежурен, особено во неработно време, не е задача во која уживаат повеќето луѓе. Дежурството може да го наруши нашиот сон, да ја попречи нормалната работа што се обидуваме да ја вршиме во текот на денот и воопшто да ни се меша во животот. Како што се повеќе и повеќе тимови учествуваат во бдеењето, го поставивме прашањето: „Што можеме ние како поединци, тимови и организации да направиме за да ги направиме бдеењето похумани и одржливи?“

Зачувајте го вашиот сон

Често првото нешто на кое луѓето размислуваат кога размислуваат за дежурство е дека тоа негативно ќе влијае на нивниот сон; никој не сака аларм за да ги разбуди среде ноќ. Ако вашата организација или тим станат доволно големи, можете да користите ротации „следи го сонцето“, каде тимовите во повеќе временски зони учествуваат во иста ротација, со пократки смени. така што секоја временска зона ќе биде на должност само за време на нејзината работа (или барем да се разбудите) часови. Воспоставувањето на таква ротација може да направи чуда за да го намали обемот на работа во текот на ноќта што го презема придружникот.

Ако немате доволно инженери и географска дистрибуција за да ја поддржите ротацијата по сонцето, сè уште има работи што можете да ги направите за да ја намалите веројатноста луѓето непотребно да се разбудат среде ноќ. На крајот на краиштата, една работа е да станеш од кревет во 4 часот наутро за да решиш итен проблем со кој се соочува клиентот; Сосема друго е да се разбудите само за да откриете дека имате работа со лажна тревога. Може да помогне да ги прегледате сите предупредувања што сте ги поставиле и да го прашате вашиот тим кои се всушност потребни за да се разбуди некого по работното време и дали тие предупредувања можат да чекаат до утрото. Може да биде тешко да ги натерате луѓето да се согласат да исклучат некои неработни предупредувања, особено ако пропуштените проблеми предизвикале проблеми во минатото, но важно е да се запамети дека инженерот без сон не е најефективниот инженер. Поставете ги овие предупредувања за време на работното време кога тие навистина се важни. Повеќето алатки за предупредување овие денови ви дозволуваат да поставите различни правила за известувања после работното време, било да се тоа периоди за известување Nagios или поставување различни распореди во PagerDuty.

Спиење, должност и тимска култура

Други решенија за нарушување на спиењето вклучуваат поголеми културни промени. Еден начин да се реши овој проблем е да се следат предупредувањата, обрнувајќи особено внимание на тоа кога тие пристигнуваат и дали тие можат да се преземат. Опснеделно е алатка креирана и објавена од Etsy која им овозможува на тимовите да ги следат и категоризираат предупредувањата што ги добиваат. Може да генерира графикони кои покажуваат колку предупредувања ги разбудиле луѓето (со користење на податоци за спиење од фитнес тракери), како и колку предупредувања всушност бараат човечка акција. Користејќи ги овие технологии, можете да ја следите ефективноста на вашата ротација на повик и нејзиното влијание врз спиењето со текот на времето.

Тимот може да игра улога во обезбедувањето дека секое лице на должност добива доволно одмор. Создадете култура која ги охрабрува луѓето да се грижат за себе: ако губите сон затоа што ве повикале ноќе, можете да спиете малку подолго наутро за да се обидете да го надоместите изгубеното време за спиење. Членовите на тимот можат да се грижат еден за друг: Кога тимовите ги споделуваат своите податоци за спиење едни со други преку нешто како Opsweekly, тие можат да одат кај своите колеги на должност и да кажат: „Еј, изгледа си имала тешка ноќ со PagerDuty минатата ноќ“. „Дали сакате да ве покријам вечерва за да можете малку да се одморите? Охрабрете ги луѓето да се поддржуваат меѓусебно на овој начин и обесхрабрете ја „културата на херојот“ каде што луѓето ќе се туркаат до крај и ќе избегнуваат да бараат помош.

Намалување на влијанието на дежурството на работа

Кога инженерите се уморни затоа што ги разбудиле додека биле на должност, очигледно нема да работат со 100% капацитет во текот на денот, но дури и без да се земе предвид недостатокот на сон, дежурството може да има и други влијанија врз работата. Една од најзначајните загуби за време на должност се должи на факторот на прекин, промена на контекстот: еден прекин може да резултира со губење на најмалку 20 минути поради губење на фокусот и менување контекст. Веројатно е дека вашите тимови ќе имаат други извори на прекини, како што се билети генерирани од други тимови, барања или прашања кои доаѓаат преку разговор и/или е-пошта. Во зависност од обемот на овие други прекини, може да размислите да ги додадете во постоечка ротација додека сте на должност или да поставите втора ротација само за да се справите со овие други барања.

Важно е да се земе предвид ова кога ја планирате работата што ќе ја изврши тимот, и долгорочно и краткорочно. Ако вашиот тим има тенденција да има прилично интензивни дежурства, овој факт треба да се земе предвид при долгорочно планирање, бидејќи може да имате ситуација кога целиот персонал е ефективно на должност во кое било дадено време, наместо да врши друга работа. При краткорочното планирање, може да откриете дека лицето што е на повик не може да ги исполни роковите поради нивните обврски на повик - ова треба да се очекува и остатокот од тимот треба да биде подготвен да се приспособи и да помогне да се осигура дека работата завршува и лицето што е на повик е поддржано во нивните работни задачи. Без оглед на тоа дали е повикан дежурниот, смената на дежурство ќе влијае на способноста на повикот да врши друга работа - не очекувајте дека повикот ќе работи ноќе за да ги заврши закажаните проекти покрај тоа што на должност по работното време.

Тимовите ќе треба да најдат начин да се справат со дополнителната работа што се создава додека се на должност. Оваа работа може да биде вистинска работа за да се поправат вистинските проблеми откриени од системите за следење и предупредување, или може да биде работа за да се поправи мониторингот и предупредувањата за да се намали бројот на лажно позитивни предупредувања. Без оглед на природата на работата што се создава, важно е таа работа да се дистрибуира правично и одржливо низ тимот. Не сите смени на дежурства се создадени еднакви, а некои се посложени од другите, така што наведувањето дека лицето што го прима предупредувањето е лицето одговорно за справување со сите последици од тоа предупредување може да доведе до нерамномерна распределба на работата. Можеби ќе има повеќе смисла дежурното лице да биде одговорно за закажување или дистрибуирање на работата, со очекување дека остатокот од тимот ќе биде подготвен да помогне да се заврши креираната работа.

Создавање и одржување рамнотежа помеѓу работата и животот

Размислете за влијанието на должноста врз вашиот живот надвор од работата. Кога сте на должност, најверојатно ќе се чувствувате врзани за вашиот мобилен телефон и лаптоп, тоа значи дека секогаш носите лаптоп и мобилен рутер (usb модем) со себе или едноставно не излегувате од вашиот дом/канцеларија. Да се ​​биде на повик обично значи да се откажете од работи како што се гледање со пријателите или семејството за време на вашата смена. Ова значи дека должината на секоја смена зависи од бројот на луѓе во вашиот тим, а зачестеноста на смените може да им нанесе непотребно оптоварување на луѓето. Можеби ќе треба да експериментирате со должината и времето на вашите смени за да најдете распоред кој работи барем за повеќето вклучени луѓе, бидејќи различните тимови и луѓе ќе имаат различни приоритети и преференции.

Од витално значење е да се препознае влијанието што должноста ќе го има врз животите на луѓето, и на ниво на управување и на индивидуално ниво. Треба да се напомене дека влијанието ќе го почувствуваат несразмерно луѓето со помали привилегии. На пример, ако треба да потрошите време за грижа за децата или другите членови на семејството или ако откриете дека поголемиот дел од домашната работа паѓа на ваши рамена, веќе имате помалку време и енергија од некој што не го прави тоа. Овој тип на работа „втора смена“ или „трета смена“ има тенденција да има непропорционално влијание врз луѓето, и ако воспоставите ротации на повик со распоред или интензитет што претпоставува дека учесниците немаат личен живот надвор од канцеларијата, ги ограничувате луѓето кои може да учествува во вашиот тим.

Охрабрете ги луѓето да се обидат да одржуваат повеќе од нивниот редовен распоред. Треба да размислите да му обезбедите на тимот мобилни рутери (USB модеми) за луѓето да можат да ја напуштат куќата со својот лаптоп и сепак да имаат некој привид на живот. Охрабрете ги луѓето да разменат дежурства едни со други, доколку е потребно, на кратки временски периоди за да можат луѓето да одат во теретана или да посетуваат лекар додека се на должност. Не создавајте култура каде што се на повик значи дека инженерите буквално не прават ништо освен да бидат на повик. Рамнотежата помеѓу работата и животот е важен дел од секоја работа, но особено кога ќе ги земете предвид часовите надвор од должноста, повозрасните членови на вашиот тим треба да даваат пример за другите во однос на рамнотежата помеѓу работата и животот, колку што е можно повеќе додека се на должност.

На индивидуално ниво, не заборавајте да им објасните што значи да се биде на должност на вашите пријатели, семејството, партнерите, домашните миленици итн. , иако тие во никој случај нема да сакаат да ви помогнат да го решите). Погрижете се да го надополните изгубеното време по завршувањето на вашата смена, без разлика дали тоа е да се гледате со пријателите, семејството или да спиете, на пример. Ако можете, размислете да поставите тивок аларм (како паметен часовник) што може да ве разбуди со зуење на зглобот за да не разбудите никого околу вас. Најдете начини да се грижите за себе кога сте во средината на дежурството и кога ќе заврши. Можеби ќе сакате да составите „комплет за преживување на повик“ кој ќе ви помогне да се опуштите: слушајте плејлиста со вашата омилена музика, читајте ја омилената книга или одвојте време да си играте со вашето домашно милениче. Менаџерите треба да ја охрабрат грижата за себе со тоа што ќе им дадат на луѓето слободен ден по една недела на должност и да се погрижат луѓето да побараат (и да добијат) помош кога им е потребна.

Подобрување на дежурното искуство

Генерално, дежурството не треба да се гледа само како страшна работа: имате можност и одговорност како дежурен човек активно да работите за да им го подобрите на луѓето кои ќе бидат на должност во иднина, што значи дека луѓето ќе добиваат помалку пораки и тие ќе бидат попрецизни. Повторно, следењето на вредноста на вашите предупредувања користејќи нешто како Opsweekly може да ви помогне да откриете што го прави вашиот повик досаден и да го поправите. За неактивни предупредувања, запрашајте се дали постојат начини да се ослободите од овие предупредувања - можеби тоа значи дека тие ќе се гасат само за време на работното време, бидејќи има некои работи на кои едноставно не треба да одговорите среде ноќ. Не плашете се да ги избришете предупредувањата, да ги промените или да го промените начинот на испраќање од „испрати на телефон и е-пошта“ во „само е-пошта“. Експериментирањето и повторувањето се клучот за подобрување на должноста со текот на времето.

За предупредувања кои се всушност акционерски, треба да размислите колку е лесно за инженерот да ги преземе потребните дејства. Секое предупредување за трчање треба да има рачна книга што оди со него - размислете да користите алатка како nagios-herald за да додадете линкови за тековни книги до вашите предупредувања. Ако предупредувањето е доволно едноставно за да не му треба книга на податоци, веројатно е доволно едноставно за да можете да го автоматизирате одговорот користејќи нешто како ракувачи со настани Nagios, што ги заштедува луѓето да се разбудат или да се прекинат за лесно автоматизирани задачи. И тековните книги и nagios-herald може да ви помогнат да додадете вреден контекст на вашите предупредувања, што ќе им помогне на луѓето поефикасно да одговорат на нив. Погледнете дали можете да одговорите на вообичаените прашања како: Кога последен пат се огласи ова предупредување? Кој одговори на тоа последен пат, и какви дејствија на крајот презедоа (ако имало)? Кои други предупредувања се појавуваат истовремено со ова и дали се поврзани? Овој тип на контекстуални информации често завршуваат само во мозокот на луѓето, така што охрабрувањето на културата на документирање и споделување контекстуални информации може да го намали износот на трошоците што се потребни за одговор на предупредувањата.

Голем дел од заморот што доаѓа од дежурствата е тоа што тие никогаш не завршуваат - ако вашиот тим има повици, малку е веројатно дека тие ќе завршат во блиска иднина. Смените никогаш не завршуваат, а можеби се чувствуваме како тие секогаш да бидат ужасни. Овој недостаток на надеж е големо ментално прашање што може да придонесе за стрес и исцрпеност, така што разгледувањето на перцепцијата (покрај реалноста) дека должноста секогаш ќе биде ужасна е добро место за да започнете да размислувате за вашата должност на долг рок.

За да се даде надеж на луѓето дека ситуацијата на дежурство некогаш ќе се подобри, неопходно е да се има набљудување на системот (истото следење и категоризација на дежурствата што ги споменав претходно). Следете колку предупредувања имате, колкав процент од нив бараат придружна интервенција, колку од нив ги будат луѓето, а потоа работете на создавање култура која ги поттикнува луѓето да ги прават работите подобро. Ако имате голем тим, може да биде примамливо, штом вашиот часовник ќе заврши, да ги кренете рацете и да кажете „тоа е проблем на идниот дежурен“ наместо да се копа за да поправи нешто - кој сака да троши повеќе напор на должност отколку од нив се бара? Ова е местото каде што културата на емпатија може да направи голема разлика, бидејќи вие не се грижите само за вашата благосостојба на должност, туку и за вашите колеги.

Се е до емпатијата

Емпатијата е важен дел од она што ни овозможува да ги поттикнеме перформансите што го подобруваат искуството на повик. Како менаџер или член, можете позитивно да ги оцените или дури и да ги наградите луѓето за однесување што ја прави смената подобра. Поддршката за операции е една од оние области каде што инженерите често се чувствуваат како луѓето да обрнуваат внимание на нив само кога нешто тргне наопаку: луѓето ќе бидат тука за да им викаат кога локацијата ќе се урне, но тие ретко учат за напорите зад сцената што ги прави операциите инженерите вложуваат напори да ја одржуваат локацијата да работи остатокот од времето. Препознавањето на работата може многу да ви помогне, без разлика дали се работи за заблагодарување на некого на состанок или во општа е-пошта за подобрување на одредено предупредување, технички аспект на дежурство или давање време некому да се покрие за друг инженер на смена некое време.

Охрабрете ги луѓето да трошат време и напор за да ја подобрат својата состојба на дежурство на долг рок. Ако вашиот тим има повици, треба да ја планирате и да и дадете приоритет на оваа работа на ист начин како што би било која друга работа на вашиот патоказ. Повикувањата се 90% ентропија и освен ако активно не работите на нивно подобрување, тие ќе се влошуваат и полоши со текот на времето. Работете со вашиот тим за да откриете што најдобро ги мотивира и наградува луѓето, а потоа искористете го тоа за да ги охрабрите луѓето да ја намалат бучавата за предупредување, да пишуваат книги и да создаваат алатки што ги решаваат нивните проблеми на повик. Што и да правите, не се задоволувајте со страшната должност како постојан дел од состојбата на работите.

Извор: www.habr.com

Додадете коментар