نویسنده موثر DevOps، Ryn Daniels، استراتژیهایی را به اشتراک میگذارد که هر کسی میتواند از آن برای ایجاد چرخش Oncall بهتر، کمتر خستهکنندهتر و پایدارتر استفاده کند.
با ظهور Devops، بسیاری از مهندسان این روزها در حال سازماندهی شیفت ها به روشی هستند که زمانی مسئولیت آن بر عهده sysadmin ها یا مهندسان عملیات بود. انجام وظیفه، به خصوص در ساعات غیر کاری، کاری نیست که بیشتر افراد از آن لذت ببرند. انجام وظیفه می تواند خواب ما را مختل کند، در کارهای عادی که در طول روز سعی در انجام آنها داریم اختلال ایجاد کند و به طور کلی در زندگی ما اختلال ایجاد کند. از آنجایی که تیمهای بیشتر و بیشتری در این مراسم شرکت میکنند، ما این سوال را مطرح میکنیم که «ما به عنوان افراد، تیمها و سازمانها چه کاری میتوانیم انجام دهیم تا این مراسمها انسانیتر و پایدارتر شوند؟»
خواب خود را ذخیره کنید
اغلب اولین چیزی که مردم در مورد انجام وظیفه فکر می کنند این است که بر خواب آنها تأثیر منفی می گذارد. هیچ کس هشداری نمی خواهد که آنها را در نیمه شب بیدار کند. اگر سازمان یا تیم شما به اندازه کافی بزرگ شود، میتوانید از چرخشهای «دنبال کردن خورشید» استفاده کنید، که در آن تیمهایی در چندین منطقه زمانی در یک چرخش شرکت میکنند، با شیفتهای وظیفه کوتاهتر. بنابراین هر منطقه زمانی فقط در طول کار خود در خدمت خواهد بود. (یا حداقل بیدار شدن) ساعت. ایجاد چنین چرخشی می تواند برای کاهش بار کاری شبانه که متصدی به عهده می گیرد معجزه کند.
اگر مهندسان و توزیع جغرافیایی کافی برای پشتیبانی از چرخش پیروی از خورشید ندارید، هنوز کارهایی وجود دارد که می توانید انجام دهید تا احتمال بیدار شدن غیرضروری افراد در نیمه شب را کاهش دهید. به هر حال، برای حل یک مشکل مبرم و پیش روی مشتری، ساعت 4 صبح از رختخواب بیرون بیایید. این کاملاً متفاوت است که از خواب بیدار شوید و متوجه شوید که با یک زنگ هشدار نادرست روبرو هستید. میتواند به مرور همه هشدارهایی که تنظیم کردهاید کمک کند و از تیم خود بپرسید که کدام هشدارها واقعاً برای بیدار کردن افراد پس از ساعتها لازم است و اینکه آیا این هشدارها میتوانند تا صبح منتظر بمانند. جلب رضایت مردم برای خاموش کردن برخی از هشدارهای غیر کاری ممکن است دشوار باشد، به خصوص اگر مشکلات از دست رفته در گذشته باعث ایجاد مشکل شده باشد، اما مهم است که به یاد داشته باشید که مهندس کم خواب موثرترین مهندس نیست. این هشدارها را در ساعات کاری زمانی که واقعا مهم هستند تنظیم کنید. اکثر ابزارهای هشدار این روزها به شما امکان می دهند قوانین مختلفی را برای اعلان های بعد از ساعت کار تنظیم کنید، چه دوره های اعلان Nagios یا تنظیم برنامه های مختلف در PagerDuty.
خواب، وظیفه و فرهنگ تیمی
راه حل های دیگر برای اختلال خواب شامل تغییرات فرهنگی بزرگتر است. یکی از راههای حل این مشکل، نظارت بر هشدارها، توجه ویژه به زمان رسیدن آنها و قابل اجرا بودن آنهاست.
این تیم می تواند در حصول اطمینان از اینکه هر فردی که وظیفه دارد استراحت کافی داشته باشد، نقش داشته باشد. فرهنگی را ایجاد کنید که مردم را تشویق کند تا از خود مراقبت کنند: اگر خوابتان را از دست دادهاید زیرا شبها به شما دعوت شده است، میتوانید صبحها کمی بیشتر بخوابید تا سعی کنید زمان از دست رفته خواب را جبران کنید. اعضای تیم میتوانند مراقب یکدیگر باشند: وقتی تیمها دادههای خواب خود را از طریق چیزی مانند Opsweekly با یکدیگر به اشتراک میگذارند، میتوانند به همکاران خود که در حال انجام وظیفه هستند بروند و بگویند: «هی، به نظر میرسد دیشب شب سختی با PagerDuty داشتی.» "دوست داری امشب تو را بپوشم تا بتوانی کمی استراحت کنی؟" مردم را تشویق کنید که از این طریق از یکدیگر حمایت کنند و از "فرهنگ قهرمان" که در آن مردم خود را به حد نهایی می رسانند و از درخواست کمک اجتناب می کنند، جلوگیری کنید.
کاهش تاثیر انجام وظیفه در محل کار
وقتی مهندسان به دلیل اینکه در حین انجام وظیفه از خواب بیدار شده اند خسته می شوند، بدیهی است که با 100 درصد ظرفیت روزانه کار نخواهند کرد، اما حتی بدون در نظر گرفتن کمبود خواب، انجام وظیفه نیز می تواند تأثیرات دیگری بر کار داشته باشد. یکی از مهم ترین تلفات در حین انجام وظیفه به دلیل ضریب وقفه، تغییر زمینه است: یک وقفه می تواند منجر به از دست دادن حداقل 20 دقیقه به دلیل از دست دادن تمرکز و تغییر زمینه شود. این احتمال وجود دارد که تیمهای شما منابع دیگری از وقفه داشته باشند، مانند بلیطهای تولید شده توسط تیمهای دیگر، درخواستها یا سؤالات از طریق چت و/یا ایمیل. بسته به حجم این وقفههای دیگر، میتوانید در حین انجام وظیفه آنها را به چرخش موجود اضافه کنید یا چرخش دوم را فقط برای رسیدگی به این درخواستهای دیگر تنظیم کنید.
هنگام برنامه ریزی کاری که تیم انجام خواهد داد، چه بلند مدت و چه کوتاه مدت، مهم است که این را در نظر بگیرید. اگر تیم شما تمایل به شیفت کاری نسبتاً شدید دارد، این واقعیت باید در برنامه ریزی بلندمدت در نظر گرفته شود، زیرا ممکن است موقعیتی داشته باشید که در آن کل کارکنان به طور موثر در هر زمان معین به جای انجام کارهای دیگر در حال انجام وظیفه باشند. در برنامهریزی کوتاهمدت، ممکن است متوجه شوید که فرد متصدی به دلیل مسئولیتهای خود نمیتواند ضربالاجلها را رعایت کند. انجام می شود و فرد در حال تماس در وظایف کاری خود پشتیبانی می شود. صرف نظر از اینکه آیا فرد آماده خدمت فراخوانده می شود یا خیر، شیفت کاری بر توانایی فرد آماده خدمت برای انجام کارهای دیگر تأثیر می گذارد - انتظار نداشته باشید که فرد آماده خدمت علاوه بر انجام پروژه های برنامه ریزی شده، شب ها نیز کار کند. در حال انجام وظیفه بعد از ساعت کاری
تیم ها باید راهی برای مقابله با کار اضافی ایجاد شده در حین انجام وظیفه پیدا کنند. این کار می تواند کار واقعی برای رفع مشکلات واقعی شناسایی شده توسط سیستم های نظارت و هشدار باشد، یا می تواند کاری برای رفع نظارت و هشدار برای کاهش تعداد هشدارهای مثبت کاذب باشد. ماهیت کار در حال ایجاد هرچه که باشد، توزیع عادلانه و پایدار آن کار در تیم مهم است. همه شیفت های نوبت کاری یکسان ایجاد نمی شوند و برخی از آنها پیچیده تر از سایرین هستند، بنابراین بیان اینکه فردی که هشدار را دریافت می کند، مسئول رسیدگی به تمام عواقب آن هشدار است، می تواند منجر به توزیع نابرابر کار شود. ممکن است منطقی تر باشد که فرد وظیفه مسئول برنامه ریزی یا توزیع کار باشد، با این انتظار که بقیه اعضای تیم مایل به کمک به تکمیل کار ایجاد شده باشند.
ایجاد و حفظ تعادل بین کار و زندگی
به تأثیری که انجام وظیفه بر زندگی شما خارج از محل کار می گذارد فکر کنید. هنگامی که در حال انجام وظیفه هستید، احتمالاً احساس می کنید که به تلفن همراه و لپ تاپ خود وابسته هستید، به این معنی که همیشه یک لپ تاپ و یک روتر موبایل (مودم usb) همراه خود دارید یا به سادگی از خانه / محل کار خود خارج نمی شوید. در نوبت بودن معمولاً به معنای کنار گذاشتن چیزهایی مانند دیدن دوستان یا خانواده در طول شیفت کاری است. این به این معنی است که طول هر شیفت به تعداد افراد تیم شما بستگی دارد و دفعات نوبت ها می تواند بار نامناسبی را بر دوش افراد وارد کند. ممکن است لازم باشد مدت و زمان شیفت های خود را آزمایش کنید تا برنامه ای را بیابید که حداقل برای اکثر افراد درگیر کار کند، زیرا تیم ها و افراد مختلف اولویت ها و ترجیحات متفاوتی خواهند داشت.
تشخیص تأثیری که انجام وظیفه بر زندگی مردم خواهد داشت، چه در سطح مدیریت و چه در سطح فردی، حیاتی است. لازم به ذکر است که تأثیر نامتناسب توسط افراد دارای امتیاز کمتر احساس خواهد شد. به عنوان مثال، اگر مجبور هستید برای مراقبت از کودکان یا سایر اعضای خانواده وقت بگذارید، یا اگر متوجه شدید که بیشتر کارهای خانه بر دوش شماست، در حال حاضر زمان و انرژی کمتری نسبت به کسی که این کار را نمی کند، دارید. این نوع کار «شیفت دوم» یا «شیفت سوم» به طور نامتناسبی بر افراد تأثیر میگذارد، و اگر چرخشهای حین تماس را با زمانبندی یا شدتی ایجاد کنید که فرض میکند شرکتکنندگان زندگی شخصی خارج از دفتر ندارند، افرادی را محدود میکنید که می تواند در تیم شما شرکت کند.
افراد را تشویق کنید تا سعی کنند بیشتر برنامه منظم خود را حفظ کنند. باید به این تیم روترهای موبایل (مودمهای USB) بدهید تا مردم بتوانند با لپتاپ خود خانه را ترک کنند و همچنان ظاهری شبیه به زندگی داشته باشند. افراد را تشویق کنید تا در صورت لزوم، در مدت زمان کوتاهی ساعات کاری را با یکدیگر معاوضه کنند تا افراد بتوانند در حین انجام وظیفه به باشگاه بروند یا به پزشک مراجعه کنند. فرهنگی را ایجاد نکنید که در آن آماده بودن به معنای واقعی کلمه مهندسان کاری جز آماده بودن انجام نمی دهند. تعادل بین کار و زندگی بخش مهمی از هر شغلی است، اما به خصوص زمانی که شما ساعات خارج از کار را در نظر می گیرید، اعضای ارشد تیم شما باید تا حد امکان در حین انجام وظیفه، از نظر تعادل بین کار و زندگی الگوی دیگران باشند.
در سطح فردی، فراموش نکنید که انجام وظیفه برای دوستان، خانواده، شریک زندگی، حیوانات خانگی و غیره چه معنایی دارد (احتمالاً گربههای شما اهمیتی نمیدهند، زیرا وقتی هشدار را دریافت میکنید ساعت 4 صبح بیدار هستند. ، اگرچه آنها به هیچ وجه نمی خواهند به شما در حل آن کمک کنند). مطمئن شوید که زمان از دست رفته را پس از پایان شیفت خود جبران می کنید، مثلاً برای دیدن دوستان، خانواده یا خوابیدن. اگر میتوانید، یک زنگ بیصدا (مانند ساعت هوشمند) تنظیم کنید که میتواند شما را با وزوز مچ بیدار کند تا اطرافیانتان را بیدار نکنید. وقتی در میانه نوبت کاری خود هستید و وقتی تمام می شود، راه هایی برای مراقبت از خود پیدا کنید. ممکن است بخواهید یک "کیت زنده ماندن در حین تماس" تهیه کنید که به شما کمک می کند آرامش داشته باشید: به لیست پخش موسیقی مورد علاقه خود گوش دهید، کتاب مورد علاقه خود را بخوانید یا زمانی را برای بازی با حیوان خانگی خود اختصاص دهید. مدیران باید با دادن یک روز مرخصی به افراد پس از یک هفته کار و اطمینان از درخواست (و دریافت) کمک در صورت نیاز، خودمراقبتی را تشویق کنند.
بهبود تجربه وظیفه
به طور کلی، انجام وظیفه نباید فقط به عنوان یک شغل وحشتناک تلقی شود: شما به عنوان یک فرد وظیفه این فرصت و مسئولیت را دارید که فعالانه کار کنید تا این کار را برای افرادی که در آینده در حال انجام وظیفه هستند، بهتر کنید، به این معنی که مردم پیام های کمتری دریافت خواهند کرد و دقیق تر خواهند بود. باز هم، ردیابی ارزش هشدارهای خود با استفاده از چیزی مانند Opsweekly می تواند به شما کمک کند تا بفهمید چه چیزی باعث آزاردهنده تماس شما می شود و آن را برطرف کنید. برای هشدارهای غیرفعال، از خود بپرسید که آیا راههایی برای خلاص شدن از شر این هشدارها وجود دارد - شاید این بدان معناست که آنها فقط در ساعات کاری خاموش میشوند، زیرا برخی چیزها وجود دارد که نیازی نیست در نیمهشب به آنها پاسخ دهید. از حذف هشدارها، تغییر آنها یا تغییر روش ارسال از «ارسال به تلفن و ایمیل» به «فقط ایمیل» نترسید. آزمایش و تکرار کلید بهبود وظیفه در طول زمان است.
برای هشدارهایی که واقعاً قابل اجرا هستند، باید در نظر داشته باشید که انجام اقدامات لازم برای یک مهندس چقدر آسان است. هر هشدار در حال اجرا باید یک runbook همراه با خود داشته باشد - استفاده از ابزاری مانند nagios-herald را برای اضافه کردن لینک های runbook به هشدارهای خود در نظر بگیرید. اگر هشدار به اندازهای ساده باشد که نیازی به runbook نداشته باشد، احتمالاً به اندازه کافی ساده است که میتوانید با استفاده از چیزی مانند کنترلکنندههای رویداد Nagios، پاسخ را خودکار کنید، که باعث میشود افراد مجبور نباشند بیدار شوند یا خودشان را برای کارهایی که به راحتی خودکار میشوند، قطع کنند. هم runbooks و هم nagios-herald میتوانند به شما کمک کنند تا زمینههای ارزشمندی را به هشدارهای خود اضافه کنید، که به مردم کمک میکند به طور مؤثرتری به آنها پاسخ دهند. ببینید آیا میتوانید به سؤالات رایج مانند: آخرین باری که این هشدار خاموش شد، پاسخ دهید؟ آخرین بار چه کسی به آن پاسخ داد و در نهایت چه اقداماتی انجام دادند (در صورت وجود)؟ چه هشدارهای دیگری همزمان با این نمایش داده می شود و آیا مرتبط هستند؟ این نوع اطلاعات متنی اغلب فقط در مغز افراد ختم می شود، بنابراین تشویق فرهنگ مستندسازی و به اشتراک گذاری اطلاعات متنی می تواند میزان سربار مورد نیاز برای پاسخ به هشدارها را کاهش دهد.
بخش بزرگی از خستگی ناشی از حین تماسها این است که هرگز پایان نمییابند—اگر تیم شما در حال تماس باشد، بعید است که در آیندهای قابل پیشبینی پایان یابد. جابجایی ها هرگز پایان نمی یابند و ممکن است احساس کنیم که همیشه وحشتناک خواهند بود. این عدم امید یک مسئله ذهنی بزرگ است که می تواند به استرس و خستگی کمک کند، بنابراین پرداختن به این تصور (علاوه بر واقعیت) که وظیفه همیشه وحشتناک خواهد بود، مکان خوبی برای شروع به فکر کردن در مورد وظیفه خود در دراز مدت است.
برای اینکه مردم را امیدوار کنیم که وضعیت کشیک روزی بهبود یابد، لازم است که سیستم قابل مشاهده باشد (همان ردیابی و طبقه بندی وظیفه که قبلاً ذکر کردم). تعداد هشدارهای خود را پیگیری کنید، چند درصد از آنها به مداخله همراه نیاز دارند، چه تعداد از آنها افراد را از خواب بیدار می کنند و سپس برای ایجاد فرهنگی تلاش کنید که مردم را تشویق به انجام بهتر کارها کند. اگر تیم بزرگی دارید، میتواند وسوسهانگیز باشد، بهمحض اینکه ساعتتان تمام شد، دستهایتان را بالا بیاورید و بگویید «این مشکل افسر وظیفه آینده است» بهجای اینکه برای رفع مشکل تلاش کنید - چه کسی میخواهد بیشتر خرج کند. تلاش در وظیفه از آنها مورد نیاز است؟ اینجاست که فرهنگ همدلی میتواند تفاوت بزرگی ایجاد کند، زیرا شما نه تنها به فکر رفاه خود در حین انجام وظیفه هستید، بلکه به فکر همکارانتان نیز هستید.
همه چیز در مورد همدلی است
همدلی بخش مهمی از چیزی است که به ما امکان میدهد عملکردی را افزایش دهیم که تجربه تماس را بهبود میبخشد. بهعنوان مدیر یا عضو، میتوانید افراد را بهخاطر رفتاری که تغییر را بهتر میکند ارزیابی مثبت یا حتی پاداش دهید. پشتیبانی عملیات یکی از حوزههایی است که مهندسان اغلب احساس میکنند که مردم فقط زمانی که مشکلی پیش میآید به آنها توجه میکنند: وقتی یک سایت خراب میشود، مردم آنجا هستند تا سر آنها فریاد بزنند، اما به ندرت در مورد تلاشهای پشت صحنه عملیات یاد میکنند. مهندسان تلاش می کنند تا سایت را در بقیه زمان ها فعال نگه دارند. تشخیص کار میتواند بسیار کمک کند، چه تشکر از شخصی در یک جلسه یا در یک ایمیل کلی برای بهبود یک هشدار خاص، یک جنبه فنی در حال انجام وظیفه، یا دادن زمان به کسی که برای مدتی برای مهندس دیگری در شیفت پوشش دهد.
افراد را تشویق کنید تا زمان و تلاش خود را برای بهبود وضعیت درازمدت خود صرف کنند. اگر تیم شما آماده خدمت است، باید این کار را به همان روشی که هر کار دیگری در نقشه راه خود انجام می دهید، برنامه ریزی و اولویت بندی کنید. تماسها 90 درصد آنتروپی هستند و اگر فعالانه برای بهبود آنها تلاش نکنید، به مرور بدتر و بدتر میشوند. با تیم خود کار کنید تا بفهمید چه چیزی به مردم انگیزه می دهد و به آنها پاداش می دهد، و سپس از آن برای تشویق مردم برای کاهش صدای هشدار، نوشتن کتابچه ها و ایجاد ابزارهایی استفاده کنید که مشکلات حین تماس آنها را حل کند. هر کاری که انجام می دهید، به وظیفه وحشتناک به عنوان بخشی دائمی از وضعیت کار رضایت ندهید.
منبع: www.habr.com