Autori i librit Effective DevOps, Ryn Daniels, ndan strategji që kushdo mund t’i përdorë për të krijuar rotacione Oncall me cilësi më të lartë, më pak bezdisëse dhe më të qëndrueshme.

Me ardhjen e DevOps, shumë inxhinierë sot po organizojnë thirrjet në një mënyrë ose në një tjetër, një detyrë që dikur ishte e rezervuar ekskluzivisht për administratorët e sistemit ose inxhinierët e operacioneve. Thirrja në gatishmëri, veçanërisht gjatë orarit jashtë punës, nuk është një detyrë që shumica e njerëzve e shijojnë. Thirrja në gatishmëri mund të na prishë gjumin, të ndërhyjë në punën e rregullt që përpiqemi të kryejmë gjatë ditës dhe të ndërhyjë në jetën tonë në përgjithësi. Ndërsa gjithnjë e më shumë ekipe marrin pjesë në thirrje në gatishmëri, ne pyetëm veten: "Çfarë mund të bëjmë ne si individë, ekipe dhe organizata për t'i bërë thirrjet në gatishmëri më humane dhe të qëndrueshme?"
Ruajtja e gjumit
Shpesh, gjëja e parë që njerëzit mendojnë kur mendojnë për gatishmërinë është ndikimi negativ që do të ketë në gjumin e tyre; askush nuk dëshiron të zgjohet nga një alarm në mes të natës. Nëse organizata ose ekipi juaj bëhet mjaftueshëm i madh, mund të zbatoni një rotacion "ndjek diellin", ku ekipet në zona të shumëfishta kohore marrin pjesë në të njëjtin rotacion, por ndërrimet e gatishmërisë janë më të shkurtra, kështu që çdo zonë kohore është në gatishmëri vetëm gjatë orarit të tyre të punës (ose të paktën zgjohet). Vendosja e një rotacioni të tillë mund të jetë një mënyrë e mrekullueshme për të zvogëluar ngarkesën e punës gjatë natës të personit në gatishmëri.
Nëse nuk keni mjaftueshëm inxhinierë dhe shpërndarjen e tyre gjeografike për të mbështetur një rotacion "ndjek diellin", ka ende gjëra që mund të bëni për të zvogëluar mundësinë që njerëzit të zgjohen pa nevojë në mes të natës. Në fund të fundit, është një gjë të zgjohesh nga shtrati në orën 4 të mëngjesit për të zgjidhur një problem urgjent me klientët; është krejt tjetër të zgjohesh vetëm për të zbuluar se po merresh me një alarm të rremë. Mund të ndihmojë të rishikoni të gjitha alarmet që keni vendosur dhe t'i kërkoni ekipit tuaj se cilat janë vërtet të nevojshme për të zgjuar dikë jashtë orarit të punës dhe nëse këto alarme mund të presin deri në mëngjes. Mund të jetë e vështirë të bindësh njerëzit të bien dakord të çaktivizojnë disa alarme jo-pune, veçanërisht nëse problemet e humbura kanë shkaktuar probleme në të kaluarën, por është e rëndësishme të mbani mend se një inxhinier i privuar nga gjumi nuk është inxhinieri më efektiv. Vendosni këto alarme për orët e punës kur ato vërtet kanë rëndësi. Shumica e mjeteve të alarmit këto ditë ju lejojnë të vendosni rregulla të ndryshme për njoftimet jashtë orarit të punës, qoftë periudha njoftimi Nagios apo vendosja e orareve të ndryshme në PagerDuty.
Gjumi, detyra dhe kultura e ekipit
Zgjidhje të tjera për ndërprerjen e gjumit përfshijnë ndryshime më të rëndësishme kulturore. Një qasje është monitorimi i alarmeve, duke i kushtuar vëmendje të veçantë kohës kur ato ndodhin dhe nëse janë efektive. — është një mjet i krijuar dhe i publikuar nga Etsy që u lejon ekipeve të gjurmojnë dhe kategorizojnë alarmet që marrin. Mund të gjenerojë grafikë që tregojnë se sa alarme i kanë zgjuar njerëzit (duke përdorur të dhënat e "Gjumit" nga gjurmuesit e fitnesit) dhe sa alarme kanë kërkuar në të vërtetë veprim njerëzor. Duke përdorur këto teknologji, ju mund të gjurmoni efektivitetin e rotacionit tuaj në gatishmëri dhe ndikimin e tij në gjumë me kalimin e kohës.
Ekipi mund të luajë një rol në sigurimin që çdo person në gatishmëri të pushojë mjaftueshëm. Krijoni një kulturë që inkurajon kujdesin për veten: nëse po humbisni gjumë sepse jeni thirrur natën, mund të flini pak më gjatë në mëngjes për të kompensuar gjumin e humbur. Anëtarët e ekipit mund të kujdesen për njëri-tjetrin: kur ekipet ndajnë të dhënat e tyre të gjumit përmes diçkaje si Opsweekly, ata mund t'u afrohen kolegëve të tyre në gatishmëri dhe t'u thonë: "Hej, duket se keni pasur një natë të vështirë me PagerDuty mbrëmë - a do të donit që unë t'ju mbuloj sonte që të mund të pushoni pak?" Inkurajoni njerëzit të mbështesin njëri-tjetrin në këtë mënyrë dhe dekurajoni një "kulturë heroike" ku njerëzit e shtyjnë veten deri në limit dhe shmangin kërkimin e ndihmës.
Zvogëlimi i ndikimit të detyrës në gatishmëri
Kur inxhinierët janë të lodhur sepse janë zgjuar gjatë gatishmërisë, ata padyshim nuk do të punojnë me kapacitet 100% gjatë gjithë ditës, por edhe pa marrë parasysh humbjen e gjumit, gatishmëria mund të ketë edhe ndikime të tjera në punë. Një nga humbjet më të rëndësishme gjatë gatishmërisë është për shkak të ndërprerjeve dhe ndërrimit të kontekstit: një ndërprerje e vetme mund të rezultojë në një humbje prej të paktën 20 minutash për shkak të humbjes së fokusit dhe ndërrimit të kontekstit. Ka të ngjarë që ekipet tuaja të kenë burime të tjera ndërprerjesh, të tilla si bileta të gjeneruara nga ekipe të tjera, kërkesa ose pyetje të marra nëpërmjet bisedës dhe/ose email-it. Në varësi të vëllimit të këtyre ndërprerjeve të tjera, mund të merrni në konsideratë shtimin e tyre në rotacionin tuaj ekzistues të gatishmërisë ose konfigurimin e një rotacioni të dytë posaçërisht për të trajtuar këto kërkesa të tjera.
Është e rëndësishme ta merrni parasysh këtë kur planifikoni punën që do të kryejë ekipi juaj, si afatgjatë ashtu edhe afatshkurtër. Nëse ekipi juaj tenton të ketë ndërrime gatishmërie mjaft intensive, kjo duhet të merret parasysh në planifikimin tuaj afatgjatë, pasi mund ta keni të gjithë stafin në gatishmëri në çdo kohë të caktuar, në vend që të punojnë në punë të tjera. Në planifikimin afatshkurtër, mund të zbuloni se personi në gatishmëri nuk është në gjendje të përmbushë afatet për shkak të përgjegjësive të tij në gatishmëri. Kjo është e pritshme dhe pjesa tjetër e ekipit duhet të jetë e përgatitur për t'u akomoduar dhe për të ndihmuar për të siguruar që puna të kryhet dhe personi në gatishmëri të mbështetet në punën e tij. Pavarësisht nëse personi në gatishmëri thirret, ndërrimi i gatishmërisë do të ndikojë në aftësinë e tij për të kryer punë të tjera - mos prisni që personi në gatishmëri të punojë natën për të përfunduar projektet e planifikuara përveçse të jetë në gatishmëri gjatë orarit të lirë.
Ekipet do të duhet të gjejnë një mënyrë për të menaxhuar punën shtesë të gjeneruar gjatë ndërrimeve të gatishmërisë. Kjo punë mund të përfshijë korrigjimin aktual të problemeve reale të zbuluara nga sistemet e monitorimit dhe alarmimit, ose mund të përfshijë korrigjimin e sistemeve të monitorimit dhe alarmimit për të zvogëluar pozitivët e rremë. Pavarësisht nga natyra e punës së gjeneruar, është e rëndësishme që kjo punë të shpërndahet në mënyrë të drejtë dhe të qëndrueshme në të gjithë ekipin. Jo të gjitha ndërrimet e gatishmërisë janë krijuar të barabarta, dhe disa janë më komplekse se të tjerat, kështu që pohimi se personi që merr një alarm është përgjegjës për zgjidhjen e të gjitha pasojave të atij alarmi mund të çojë në një shpërndarje të pabarabartë të punës. Mund të jetë më e arsyeshme që personi në gatishmëri të jetë përgjegjës për planifikimin ose shpërndarjen e punës, me pritjen që pjesa tjetër e ekipit do të jetë e disponueshme për të ndihmuar në përfundimin e punës së gjeneruar.
Krijimi dhe ruajtja e një ekuilibri midis punës dhe jetës personale
Merrni në konsideratë ndikimin në jetën tuaj jashtë punës. Kur jeni në gatishmëri, ka të ngjarë të ndiheni të lidhur me telefonin celular dhe laptopin, që do të thotë se gjithmonë do ta mbani me vete laptopin dhe routerin celular (modemin USB), ose thjesht nuk dilni nga shtëpia ose zyra juaj. Të qenit në gatishmëri zakonisht do të thotë të hiqni dorë nga gjëra të tilla si takimet me miqtë ose familjen gjatë turnit tuaj. Kjo do të thotë që kohëzgjatja e çdo turni varet nga numri i njerëzve në ekipin tuaj, dhe frekuenca e ndërrimeve mund të bëhet një barrë e tepërt për njerëzit. Mund t'ju duhet të eksperimentoni me kohëzgjatjen dhe orarin e ndërrimeve tuaja për të gjetur një orar që funksionon të paktën për shumicën e njerëzve të përfshirë, pasi ekipe dhe njerëz të ndryshëm do të kenë përparësi dhe preferenca të ndryshme.
Është thelbësore të kuptohet ndikimi që do të ketë gatishmëria në jetën e njerëzve, si në nivel menaxhimi ashtu edhe në atë individual. Vlen të përmendet se ndikimi do të ndihet më rëndë nga ata me më pak privilegje. Për shembull, nëse duhet të kaloni kohë duke u kujdesur për fëmijët ose anëtarët e tjerë të familjes, ose nëse e gjeni veten duke mbajtur pjesën më të madhe të punëve të shtëpisë, tashmë keni më pak kohë dhe energji sesa dikush që nuk i ka këto përgjegjësi. Një punë e tillë në "turnin e dytë" ose "turnin e tretë" tenton të ndikojë në mënyrë disproporcionale tek njerëzit, dhe nëse vendosni rotacione gatishmërie me një orar ose intensitet që supozon se pjesëmarrësit nuk kanë jetë personale jashtë zyrës, ju kufizoni njerëzit që mund të kontribuojnë në ekipin tuaj.
Inkurajoni njerëzit që të përpiqen të mbajnë sa më shumë të jetë e mundur orarin e tyre normal. Merrni në konsideratë pajisjen e ekipit me routerë celularë (modeme USB) në mënyrë që njerëzit të mund të dalin nga shtëpia me laptopët e tyre dhe të kenë ende njëfarë jete të këndshme. Inkurajoni njerëzit të shkëmbejnë orët e gatishmërisë me njëri-tjetrin, nëse është e nevojshme, për periudha të shkurtra kohore, në mënyrë që njerëzit të mund të shkojnë në palestër ose të vizitojnë mjekun ndërsa janë në gatishmëri. Mos krijoni një kulturë ku të qenit në gatishmëri do të thotë që inxhinierët fjalë për fjalë nuk bëjnë asgjë tjetër përveçse të jenë në gatishmëri. Ekuilibri midis punës dhe jetës personale është një pjesë e rëndësishme e çdo pune, por veçanërisht kur merren në konsideratë oraret jashtë orarit, anëtarët më të lartë të ekipit tuaj duhet të japin shembull për të tjerët në aspektin e ekuilibrit midis punës dhe jetës personale, sa më shumë që të jetë e mundur gjatë gatishmërisë.
Në nivel individual, sigurohuni që t'u shpjegoni miqve, anëtarëve të familjes, partnerëve, kafshëve shtëpiake etj., se çfarë do të thotë të jesh në gatishmëri (macet tuaja ka shumë të ngjarë të mos interesohen, pasi ato janë zgjuar në orën 4 të mëngjesit kur bie alarmi juaj, megjithëse do të ngurrojnë t'ju ndihmojnë me të). Sigurohuni që ta kompensoni kohën e humbur pasi të mbarojë turni juaj, qoftë kjo takim me miqtë, familjen apo gjumë. Nëse është e mundur, merrni në konsideratë vendosjen e një alarmi të heshtur (si një orë inteligjente) që mund t'ju zgjojë duke tingëlluar kyçin e dorës në mënyrë që të mos zgjoni askënd tjetër. Gjeni mënyra për t'u kujdesur për veten si gjatë ashtu edhe pas mbarimit të turnit tuaj. Mund të dëshironi të krijoni një "kit mbijetese në gatishmëri" për t'ju ndihmuar të relaksoheni: duke dëgjuar listën tuaj të preferuar të muzikës, duke lexuar një libër të preferuar ose duke lënë mënjanë kohë për të luajtur me një kafshë shtëpiake. Menaxherët duhet të inkurajojnë kujdesin për veten duke u dhënë njerëzve një ditë pushim pas një jave në detyrë dhe duke u siguruar që njerëzit të kërkojnë (dhe të marrin) ndihmë kur kanë nevojë për të.
Përmirësimi i përvojës në detyrë
Në përgjithësi, të qenit në gatishmëri nuk duhet të perceptohet si një punë e tmerrshme: si dikush i përfshirë në gatishmëri, ju keni mundësinë dhe përgjegjësinë për të punuar në mënyrë aktive për ta bërë atë më të mirë për telefonuesit e ardhshëm, që do të thotë më pak njoftime dhe më të sakta. Përsëri, ndjekja e vlerës së alarmeve tuaja duke përdorur diçka si Opsweekly mund t'ju ndihmojë të kuptoni se çfarë po e bën përvojën tuaj në gatishmëri bezdisëse dhe ta adresoni atë. Për alarmet joaktive, pyeteni veten nëse ka mënyra për t'i eliminuar ato - ndoshta kjo do të thotë t'i aktivizoni ato vetëm gjatë orarit të punës, sepse ka disa gjëra që thjesht nuk keni nevojë t'u përgjigjeni në mes të natës. Mos kini frikë të fshini alarmet, t'i ndryshoni ato ose të ndryshoni metodën e dorëzimit nga "dërgoni në telefon dhe email" në "vetëm dërgoni në email". Eksperimentimi dhe përsëritja janë çelësi për përmirësimin e përvojave në gatishmëri me kalimin e kohës.
Për alarmet që janë vërtet të zbatueshme, duhet të merrni në konsideratë sa e lehtë është për një inxhinier të kryejë veprimet e nevojshme. Çdo alarm funksional duhet të ketë një runbook të bashkangjitur me të - merrni në konsideratë përdorimin e një mjeti si nagios-herald për të shtuar lidhje runbook në alarmet tuaja. Nëse një alarm është aq i thjeshtë sa nuk kërkon një runbook, ndoshta është gjithashtu aq i thjeshtë sa të mund të automatizoni përgjigjen duke përdorur diçka si trajtuesit e ngjarjeve Nagios, gjë që eliminon nevojën që njerëzit të zgjohen ose të ndërpresin veten për detyra lehtësisht të automatizuara. Si runbooks ashtu edhe nagios-herald mund t'ju ndihmojnë të shtoni kontekst të vlefshëm në alarmet tuaja, gjë që do t'i ndihmojë njerëzit t'u përgjigjen atyre në mënyrë më efektive. Shikoni nëse mund t'u përgjigjeni pyetjeve të zakonshme si: Kur u aktivizua ky alarm për herë të fundit? Kush iu përgjigj herën e fundit dhe çfarë veprimesh, nëse ka, ndërmorën ata në fund të fundit? Çfarë alarmesh të tjera po shfaqen në të njëjtën kohë dhe a janë të lidhura ato? Ky lloj informacioni kontekstual shpesh banon vetëm në mendjet e njerëzve, kështu që inkurajimi i një kulture të dokumentimit dhe ndarjes së informacionit kontekstual mund të zvogëlojë kostot e nevojshme për t'iu përgjigjur alarmeve.
Një pjesë e rëndësishme e lodhjes që vjen me gatishmërinë është se ajo nuk mbaron kurrë - nëse ekipi juaj ka gatishmëri, nuk ka gjasa të mbarojë së shpejti. Gatishmëria nuk mbaron kurrë dhe mund të ndihemi sikur do të jetë gjithmonë e tmerrshme. Kjo mungesë shprese është një sfidë e madhe mendore që mund të kontribuojë në stres dhe lodhje, kështu që adresimi i perceptimit (përveç realitetit) se gatishmëria do të jetë gjithmonë e tmerrshme është një fillim i mirë për të menduar për jetën tuaj në gatishmëri në planin afatgjatë.
Për t'u dhënë njerëzve shpresë se situata e gatishmërisë do të përmirësohet ndonjëherë, është thelbësore të keni dukshmëri të sistemit (e njëjta gjurmim dhe kategorizim në gatishmëri që përmenda më parë). Mbani shënim sa alarme keni, çfarë përqindjeje të tyre kërkojnë ndërhyrje në gatishmëri, sa prej tyre i zgjojnë njerëzit dhe më pas punoni për të krijuar një kulturë që i inkurajon njerëzit të bëjnë më mirë. Nëse keni një ekip të madh, mund të jetë joshëse, sapo të mbarojë turni juaj i gatishmërisë, të ngrini duart lart dhe të thoni: "Ky është problemi i personit tjetër në gatishmëri", në vend që të përfshiheni për ta zgjidhur atë - kush dëshiron të shpenzojë më shumë përpjekje në gatishmëri sesa kërkohet? Këtu është vendi ku një kulturë empatie mund të bëjë një ndryshim të madh, sepse nuk po kujdeseni vetëm për mirëqenien tuaj në gatishmëri, por edhe për kolegët tuaj.
Bëhet fjalë për empatinë
Empatia është një pjesë thelbësore e asaj që na lejon të nxisim punën që përmirëson përvojën në gatishmëri. Si menaxher ose pjesëmarrës, ju mund t'i njihni ose madje t'i shpërbleni njerëzit pozitivisht për sjelljen e tyre që përmirëson përvojat në gatishmëri. Mbështetja e operacioneve është një fushë ku inxhinierët shpesh mendojnë se njerëzit u kushtojnë vëmendje vetëm kur diçka shkon keq: njerëzit do të jenë aty për t'u bërtitur kur faqja e internetit bllokohet, por ata rrallë mësojnë për përpjekjet prapa skenave që inxhinierët e operacioneve bëjnë për ta mbajtur faqen në punë pjesën tjetër të kohës. Njohja e punës së tyre mund të ndihmojë shumë, qoftë falënderimi i dikujt në një takim apo në një email të përbashkët për përmirësimin e një alarmi specifik, një aspekti teknik të përvojës në gatishmëri, apo dhënia e kohës dikujt për të mbuluar një inxhinier tjetër në turn për një kohë.
Inkurajoni njerëzit të investojnë kohë dhe përpjekje në përmirësimin e situatave në gatishmëri në planin afatgjatë. Nëse ekipi juaj ka staf në gatishmëri, duhet t'i planifikoni dhe t'i prioritizoni ata njësoj si çdo detyrë tjetër në planin tuaj. Stafi në gatishmëri është 90% entropi, dhe nëse nuk punoni në mënyrë aktive për t'i përmirësuar ata, ata do të përkeqësohen gjithnjë e më shumë me kalimin e kohës. Punoni me ekipin tuaj për të kuptuar se çfarë i motivon dhe inkurajon njerëzit më mirë, dhe më pas përdoreni këtë për t'i inkurajuar ata të zvogëlojnë zhurmën e alarmit, të shkruajnë manuale dhe të krijojnë mjete që zgjidhin problemet e tyre në gatishmëri. Çfarëdo që të bëni, mos e pranoni stafin e tmerrshëm në gatishmëri si një pjesë të përhershme të situatës.
Burimi: www.habr.com
