O čemu treba razmišljati pri implementaciji smjena

Autor efektivnog DevOps-a Ryn Daniels dijeli strategije koje svako može koristiti za stvaranje boljih, manje frustrirajućih i održivijih Oncall rotacija.

O čemu treba razmišljati pri implementaciji smjena

Sa pojavom Devopsa, mnogi inženjeri ovih dana organiziraju smjene na ovaj ili onaj način, što je nekada bila isključiva odgovornost sistemskih administratora ili operativnih inženjera. Dežurstvo, posebno u vanradno vrijeme, nije zadatak u kojem većina ljudi uživa. Dežurstvo može poremetiti naš san, ometati normalan posao koji pokušavamo obavljati tokom dana i ometati naše živote općenito. Kako sve više timova učestvuje u bdenjima, postavili smo pitanje: „Šta mi kao pojedinci, timovi i organizacije možemo učiniti da bdenja budu humanija i održivija?“

Sačuvaj svoj san

Često prva stvar na koju ljudi pomisle kada pomisle na dežurstvo je da će to negativno uticati na njihov san; niko ne želi uzbunu da ih probudi usred noći. Ako vaša organizacija ili tim postanu dovoljno veliki, možete koristiti "prati sunce" rotacije, gdje timovi u više vremenskih zona učestvuju u istoj rotaciji, sa kraćim smjenama. tako da će svaka vremenska zona dežurati samo tokom svog poslovanja (ili se barem probuditi) sati. Uspostavljanje takve rotacije može učiniti čuda kako bi se smanjio noćni rad koji pratilac preuzima.

Ako nemate dovoljno inženjera i geografsku distribuciju da podržite rotaciju praćenja sunca, još uvijek postoje stvari koje možete učiniti da smanjite vjerovatnoću da će se ljudi nepotrebno probuditi usred noći. Na kraju krajeva, jedna je stvar ustati iz kreveta u 4 sata ujutro kako bi se riješio hitan problem sa klijentima; Sasvim je drugo probuditi se i otkriti da imate posla s lažnom uzbunom. Može vam pomoći da pregledate sva upozorenja koja ste postavili i pitate svoj tim koja su zapravo potrebna da biste nekoga probudili nakon radnog vremena i da li ta upozorenja mogu čekati do jutra. Može biti teško natjerati ljude da pristanu da isključe neka upozorenja koja ne rade, posebno ako su propušteni problemi uzrokovali probleme u prošlosti, ali važno je zapamtiti da inženjer lišen sna nije najefikasniji inženjer. Postavite ova upozorenja tokom radnog vremena kada su zaista bitna. Većina alata za upozorenje ovih dana vam omogućava da postavite različita pravila za obavještenja nakon radnog vremena, bilo da se radi o Nagios periodima obavještenja ili postavljanju različitih rasporeda u PagerDuty.

Spavanje, dežurstvo i timska kultura

Druga rješenja za poremećaj sna uključuju veće kulturne promjene. Jedan od načina da se riješi ovaj problem je praćenje upozorenja, obraćajući posebnu pažnju na to kada stignu i da li su podložna mjerama. Opsweekly je alat koji je kreirao i objavio Etsy koji omogućava timovima da prate i kategoriziraju upozorenja koja primaju. Može generirati grafikone koji pokazuju koliko je upozorenja probudilo ljude (koristeći podatke o spavanju iz fitnes trackera), kao i koliko je upozorenja zapravo zahtijevalo ljudsku akciju. Koristeći ove tehnologije, možete pratiti efikasnost rotacije na pozivu i njen uticaj na san tokom vremena.

Tim može igrati ulogu u osiguravanju da se svaka osoba na dužnosti adekvatno odmori. Stvorite kulturu koja podstiče ljude da se brinu o sebi: ako gubite san jer ste pozvani noću, ujutro možete spavati malo duže kako biste pokušali nadoknaditi izgubljeno vrijeme za spavanje. Članovi tima mogu paziti jedni na druge: Kada timovi dijele svoje podatke o spavanju jedni s drugima putem nečega poput Opsweeklyja, mogu otići do svojih kolega na dužnosti i reći: “Hej, izgleda da ste sinoć imali tešku noć sa PagerDutyjem.” „Hoćeš li da te pokrijem večeras da se malo odmoriš?“ Ohrabrite ljude da podržavaju jedni druge na ovaj način i obeshrabrite „kulturu heroja“ u kojoj će se ljudi dotjerati do krajnjih granica i izbjegavati traženje pomoći.

Smanjenje uticaja dežurstva na poslu

Kada su inženjeri umorni jer su se probudili dok su bili na dužnosti, očigledno neće raditi sa 100% kapaciteta tokom dana, ali čak i bez uzimanja u obzir deprivacije sna, dežurstvo može imati i druge uticaje na posao. Jedan od najznačajnijih gubitaka tokom dužnosti je zbog faktora prekida, promjene konteksta: jedan prekid može rezultirati gubitkom od najmanje 20 minuta zbog gubitka fokusa i promjene konteksta. Vjerovatno je da će vaši timovi imati druge izvore prekida, kao što su karte koje generiraju drugi timovi, zahtjevi ili pitanja koja dolaze putem ćaskanja i/ili e-pošte. Ovisno o količini ovih drugih prekida, možete razmisliti o tome da ih dodate postojećoj rotaciji dok ste na dužnosti ili da postavite drugu rotaciju samo da biste obradili ove druge zahtjeve.

Važno je to uzeti u obzir kada planirate posao koji će tim raditi, kako dugoročno tako i kratkoročno. Ako vaš tim ima tendenciju da ima prilično intenzivne dežurstva, ovu činjenicu treba uzeti u obzir u dugoročnom planiranju, jer možete imati situaciju u kojoj je cijelo osoblje efektivno na dužnosti u bilo kojem trenutku, umjesto da obavlja druge poslove. U kratkoročnom planiranju, možda ćete otkriti da dežurna osoba nije u mogućnosti da ispoštuje rokove zbog svojih dežurnih obaveza – to bi trebalo očekivati ​​i ostatak tima bi trebao biti voljan da se prilagodi i pomogne kako bi se osiguralo da posao završi i dežurna osoba ima podršku u svojim radnim zadacima. Bez obzira na to da li je dežurna osoba pozvana, dežurna smjena će uticati na sposobnost dežurne osobe da obavlja druge poslove—ne očekujte da dežurna osoba radi noću kako bi završila planirane projekte osim što je dežura van radnog vremena.

Timovi će morati da pronađu način da se izbore sa dodatnim poslom koji se stvara tokom dežurstva. Ovaj posao bi mogao biti pravi rad na rješavanju stvarnih problema otkrivenih sistemima za praćenje i upozorenje, ili bi to mogao biti rad na popravljanju nadzora i upozorenja kako bi se smanjio broj lažno pozitivnih upozorenja. Bez obzira na prirodu posla koji se stvara, važno je da se taj rad pošteno i održivo rasporedi u timu. Nisu sve dežurstva jednake, a neke su složenije od drugih, pa navođenje da je osoba koja prima upozorenje odgovorna za rješavanje svih posljedica tog upozorenja može dovesti do neravnomjerne raspodjele posla. Možda bi bilo logičnije da dežurna osoba bude odgovorna za zakazivanje ili distribuciju posla, uz očekivanje da će ostatak tima biti voljan pomoći u dovršenju posla.

Stvaranje i održavanje ravnoteže između posla i života

Razmislite o uticaju dužnosti na vaš život van posla. Kada ste na dužnosti, vjerovatno ćete se osjećati vezani za mobilni telefon i laptop, što znači da uvijek sa sobom nosite laptop i mobilni ruter (usb modem) ili jednostavno ne izlazite iz kuće/kancelarije. Dežurstvo obično znači odustajanje od stvari poput viđanja sa prijateljima ili porodicom tokom smjene. To znači da dužina svake smjene ovisi o broju ljudi u vašem timu, a učestalost smjena može predstavljati nepotrebno opterećenje za ljude. Možda ćete morati eksperimentirati s dužinom i vremenom smjena kako biste pronašli raspored koji odgovara barem većini uključenih ljudi, jer će različiti timovi i ljudi imati različite prioritete i preferencije.

Od vitalnog je značaja prepoznati uticaj koji će dežurstvo imati na živote ljudi, kako na nivou upravljanja, tako i na nivou pojedinca. Treba napomenuti da će uticaj nesrazmjerno osjetiti ljudi s manje privilegija. Na primjer, ako morate provoditi vrijeme brinući se o djeci ili drugim članovima porodice, ili ako ustanovite da većina kućnih poslova pada na vaša ramena, već imate manje vremena i energije od nekoga ko nema odgovornosti. Ova vrsta rada u "drugoj smjeni" ili "trećoj smjeni" ima tendenciju da neproporcionalno utiče na ljude, a ako uspostavite rotacije dežurstava sa rasporedom ili intenzitetom koji pretpostavlja da učesnici nemaju lični život izvan kancelarije, ograničavate ljude koji može učestvovati u vašem timu.

Ohrabrite ljude da pokušaju da se više pridržavaju svog redovnog rasporeda. Trebalo bi da razmislite o tome da timu obezbedite mobilne rutere (usb modeme) kako bi ljudi mogli da napuste kuću sa svojim laptopom i da i dalje imaju neki privid života. Ohrabrite ljude da razmenjuju sate dežurstva jedni s drugima, ako je potrebno, na kraće vremenske periode kako bi ljudi mogli da idu u teretanu ili da posete lekara dok su na dužnosti. Nemojte stvarati kulturu u kojoj dežurstvo znači da inženjeri doslovno ne rade ništa osim da budu dežurni. Ravnoteža između poslovnog i privatnog života važan je dio svakog posla, ali posebno kada uzmete u obzir vrijeme van radnog vremena, stariji članovi vašeg tima bi trebali biti primjer drugima u smislu ravnoteže između poslovnog i privatnog života, što je više moguće dok su na dužnosti.

Na individualnom nivou, ne zaboravite objasniti šta znači dežurstvo vašim prijateljima, porodici, partnerima, kućnim ljubimcima, itd. (vaše mačke vjerovatno neće biti briga jer su već u 4 ujutro kada dobijete upozorenje , iako vam ni na koji način neće htjeti pomoći da to riješite). Pobrinite se da nadoknadite izgubljeno vrijeme nakon završetka smjene, bilo da se viđate s prijateljima, porodicom ili spavate, na primjer. Ako možete, razmislite o postavljanju tihog alarma (poput pametnog sata) koji vas može probuditi zujanjem na zglobu kako ne biste probudili nikoga oko sebe. Pronađite načine da se brinete o sebi kada ste usred dežurstva i kada se završi. Možda ćete poželjeti da sastavite “komplet za preživljavanje na poziv” koji će vam pomoći da se opustite: slušajte listu za reprodukciju svoje omiljene muzike, čitajte svoju omiljenu knjigu ili odvojite vrijeme za igru ​​sa svojim ljubimcem. Menadžeri bi trebali podsticati brigu o sebi tako što će ljudima dati slobodan dan nakon sedmice na dužnosti i osigurati da ljudi traže (i dobiju) pomoć kada im je potrebna.

Poboljšanje radnog iskustva

Sve u svemu, dežurstvo ne treba posmatrati samo kao užasan posao: imate priliku i odgovornost kao dežurna osoba da aktivno radite na tome da bude bolje za ljude koji će dežurati u budućnosti, što znači da ljudi će primati manje poruka i one će biti preciznije. Opet, praćenje vrijednosti vaših upozorenja pomoću nečega poput Opsweeklyja može vam pomoći da shvatite što čini vaše dežurstvo dosadnim i da to popravite. Za neaktivna upozorenja, zapitajte se da li postoje načini da se riješite ovih upozorenja - možda to znači da će se oglasiti samo tokom radnog vremena, jer postoje neke stvari na koje jednostavno ne morate odgovarati usred noći. Nemojte se bojati izbrisati upozorenja, promijeniti ih ili promijeniti način slanja iz "pošalji na telefon i e-poštu" u "samo putem e-pošte". Eksperimentiranje i ponavljanje su ključ za poboljšanje rada tokom vremena.

Za upozorenja koja su stvarno djelotvorna, trebali biste razmotriti koliko je inženjeru lako poduzeti potrebne radnje. Svako upozorenje o pokretanju treba da ima runbook koji ide uz njega - razmislite o korišćenju alata kao što je nagios-herald da dodate runbook veze u vaša upozorenja. Ako je upozorenje dovoljno jednostavno da mu nije potreban runbook, vjerovatno je dovoljno jednostavno da možete automatizirati odgovor koristeći nešto poput Nagios obrađivača događaja, što štedi ljude da se probude ili prekidaju radi lako automatiziranih zadataka. I runbooks i nagios-herald mogu vam pomoći da dodate vrijedan kontekst vašim upozorenjima, što će pomoći ljudima da efikasnije reaguju na njih. Provjerite možete li odgovoriti na uobičajena pitanja kao što su: Kada se posljednji put oglasilo ovo upozorenje? Ko je odgovorio na to prošli put i koje su radnje na kraju poduzeli (ako ih je bilo)? Koja se druga upozorenja pojavljuju istovremeno s ovim i jesu li povezana? Ova vrsta kontekstualnih informacija često završava samo u mozgu ljudi, tako da poticanje kulture dokumentiranja i dijeljenja kontekstualnih informacija može smanjiti količinu dodatnih troškova potrebnih za odgovor na upozorenja.

Veliki dio zamora koji dolazi od dežurstava je to što oni nikada ne prestaju—ako vaš tim ima dežurstva, malo je vjerovatno da će se završiti u doglednoj budućnosti. Smjene se nikada ne završavaju, i možemo se osjećati kao da će uvijek biti strašne. Ovaj nedostatak nade je veliki mentalni problem koji može doprinijeti stresu i iscrpljenosti, tako da je rješavanje percepcije (pored realnosti) da će dužnost uvijek biti strašno dobro mjesto da počnete razmišljati o svojoj dužnosti na duži rok.

Da bi ljudima dali nadu da će se stanje dežurstva ikada poboljšati, potrebno je imati uvidljivost sistema (isto praćenje i kategorizaciju dežurstva koje sam ranije pomenuo). Pratite koliko upozorenja imate, koliki postotak njih zahtijeva intervenciju, koliko ih probudi ljude, a zatim radite na stvaranju kulture koja potiče ljude da rade stvari bolje. Ako imate veliki tim, može biti primamljivo, čim vam sat dođe do kraja, dignuti ruke i reći "to je problem budućeg dežurnog" umjesto da se kopate da nešto popravite - ko želi više potrošiti napor na dužnosti nego od njih potreban? Ovdje kultura empatije može napraviti veliku razliku, jer ne pazite samo na svoju dobrobit na dužnosti, već i na svoje kolege.

Sve je u empatiji

Empatija je važan dio onoga što nam omogućava da poboljšamo performanse koje poboljšavaju iskustvo dežurstva. Kao menadžer ili član, možete pozitivno ocijeniti ili čak nagraditi ljude za ponašanje koje čini smjenu boljim. Operativna podrška jedno je od onih područja u kojima se inženjeri često osjećaju kao da ljudi obraćaju pažnju na njih samo kada nešto pođe po zlu: ljudi će biti tu da vikaju na njih kada se web lokacija sruši, ali rijetko uče o naporima iza kulisa koje operacije inženjeri su se uložili u održavanje stranice sve ostalo vrijeme. Prepoznavanje rada može imati dug put, bilo da se radi o zahvaljivanju nekome na sastanku ili u općoj e-poruci za poboljšanje određenog upozorenja, tehničkom aspektu dežurstva ili davanju vremena nekome da neko vrijeme pokrije drugog inženjera u smjeni.

Ohrabrite ljude da utroše vrijeme i trud kako bi dugoročno poboljšali svoju situaciju dežurstva. Ako vaš tim ima dežurstva, trebalo bi da planirate i odredite prioritete za ovaj posao na isti način kao i na bilo koji drugi rad na vašoj mapi puta. Dežurstva su 90% entropije i ako ne radite aktivno na njihovom poboljšanju, vremenom će se pogoršavati i pogoršavati. Radite sa svojim timom kako biste otkrili što najbolje motivira i nagrađuje ljude, a zatim to iskoristite da ohrabrite ljude da smanje buku upozorenja, napišu runbookove i kreiraju alate koji rješavaju njihove probleme na poziv. Šta god da radite, nemojte pristajati na strašnu dužnost kao stalni dio stanja stvari.

izvor: www.habr.com

Dodajte komentar