هنگام اجرای شیفت ها به چه چیزهایی باید فکر کرد

نویسنده موثر DevOps، Ryn Daniels، استراتژی‌هایی را به اشتراک می‌گذارد که هر کسی می‌تواند از آن برای ایجاد چرخش Oncall بهتر، کمتر خسته‌کننده‌تر و پایدارتر استفاده کند.

هنگام اجرای شیفت ها به چه چیزهایی باید فکر کرد

با ظهور Devops، بسیاری از مهندسان این روزها در حال سازماندهی شیفت ها به روشی هستند که زمانی مسئولیت آن بر عهده sysadmin ها یا مهندسان عملیات بود. انجام وظیفه، به خصوص در ساعات غیر کاری، کاری نیست که بیشتر افراد از آن لذت ببرند. انجام وظیفه می تواند خواب ما را مختل کند، در کارهای عادی که در طول روز سعی در انجام آنها داریم اختلال ایجاد کند و به طور کلی در زندگی ما اختلال ایجاد کند. از آنجایی که تیم‌های بیشتر و بیشتری در این مراسم شرکت می‌کنند، ما این سوال را مطرح می‌کنیم که «ما به عنوان افراد، تیم‌ها و سازمان‌ها چه کاری می‌توانیم انجام دهیم تا این مراسم‌ها انسانی‌تر و پایدارتر شوند؟»

خواب خود را ذخیره کنید

اغلب اولین چیزی که مردم در مورد انجام وظیفه فکر می کنند این است که بر خواب آنها تأثیر منفی می گذارد. هیچ کس هشداری نمی خواهد که آنها را در نیمه شب بیدار کند. اگر سازمان یا تیم شما به اندازه کافی بزرگ شود، می‌توانید از چرخش‌های «دنبال کردن خورشید» استفاده کنید، که در آن تیم‌هایی در چندین منطقه زمانی در یک چرخش شرکت می‌کنند، با شیفت‌های وظیفه کوتاه‌تر. بنابراین هر منطقه زمانی فقط در طول کار خود در خدمت خواهد بود. (یا حداقل بیدار شدن) ساعت. ایجاد چنین چرخشی می تواند برای کاهش بار کاری شبانه که متصدی به عهده می گیرد معجزه کند.

اگر مهندسان و توزیع جغرافیایی کافی برای پشتیبانی از چرخش پیروی از خورشید ندارید، هنوز کارهایی وجود دارد که می توانید انجام دهید تا احتمال بیدار شدن غیرضروری افراد در نیمه شب را کاهش دهید. به هر حال، برای حل یک مشکل مبرم و پیش روی مشتری، ساعت 4 صبح از رختخواب بیرون بیایید. این کاملاً متفاوت است که از خواب بیدار شوید و متوجه شوید که با یک زنگ هشدار نادرست روبرو هستید. می‌تواند به مرور همه هشدارهایی که تنظیم کرده‌اید کمک کند و از تیم خود بپرسید که کدام هشدارها واقعاً برای بیدار کردن افراد پس از ساعت‌ها لازم است و اینکه آیا این هشدارها می‌توانند تا صبح منتظر بمانند. جلب رضایت مردم برای خاموش کردن برخی از هشدارهای غیر کاری ممکن است دشوار باشد، به خصوص اگر مشکلات از دست رفته در گذشته باعث ایجاد مشکل شده باشد، اما مهم است که به یاد داشته باشید که مهندس کم خواب موثرترین مهندس نیست. این هشدارها را در ساعات کاری زمانی که واقعا مهم هستند تنظیم کنید. اکثر ابزارهای هشدار این روزها به شما امکان می دهند قوانین مختلفی را برای اعلان های بعد از ساعت کار تنظیم کنید، چه دوره های اعلان Nagios یا تنظیم برنامه های مختلف در PagerDuty.

خواب، وظیفه و فرهنگ تیمی

راه حل های دیگر برای اختلال خواب شامل تغییرات فرهنگی بزرگتر است. یکی از راه‌های حل این مشکل، نظارت بر هشدارها، توجه ویژه به زمان رسیدن آنها و قابل اجرا بودن آنهاست. به صورت هفتگی ابزاری است که توسط Etsy ایجاد و منتشر شده است که به تیم ها اجازه می دهد تا هشدارهای دریافتی خود را ردیابی و دسته بندی کنند. این می‌تواند نمودارهایی را تولید کند که نشان می‌دهد چند هشدار مردم را بیدار کرده است (با استفاده از داده‌های خواب از ردیاب‌های تناسب اندام)، و همچنین تعداد هشدارهایی که واقعاً به اقدامات انسانی نیاز دارند. با استفاده از این فناوری‌ها، می‌توانید اثربخشی چرخش حین تماس و تأثیر آن بر خواب را در طول زمان پیگیری کنید.

این تیم می تواند در حصول اطمینان از اینکه هر فردی که وظیفه دارد استراحت کافی داشته باشد، نقش داشته باشد. فرهنگی را ایجاد کنید که مردم را تشویق کند تا از خود مراقبت کنند: اگر خوابتان را از دست داده‌اید زیرا شب‌ها به شما دعوت شده است، می‌توانید صبح‌ها کمی بیشتر بخوابید تا سعی کنید زمان از دست رفته خواب را جبران کنید. اعضای تیم می‌توانند مراقب یکدیگر باشند: وقتی تیم‌ها داده‌های خواب خود را از طریق چیزی مانند Opsweekly با یکدیگر به اشتراک می‌گذارند، می‌توانند به همکاران خود که در حال انجام وظیفه هستند بروند و بگویند: «هی، به نظر می‌رسد دیشب شب سختی با PagerDuty داشتی.» "دوست داری امشب تو را بپوشم تا بتوانی کمی استراحت کنی؟" مردم را تشویق کنید که از این طریق از یکدیگر حمایت کنند و از "فرهنگ قهرمان" که در آن مردم خود را به حد نهایی می رسانند و از درخواست کمک اجتناب می کنند، جلوگیری کنید.

کاهش تاثیر انجام وظیفه در محل کار

وقتی مهندسان به دلیل اینکه در حین انجام وظیفه از خواب بیدار شده اند خسته می شوند، بدیهی است که با 100 درصد ظرفیت روزانه کار نخواهند کرد، اما حتی بدون در نظر گرفتن کمبود خواب، انجام وظیفه نیز می تواند تأثیرات دیگری بر کار داشته باشد. یکی از مهم ترین تلفات در حین انجام وظیفه به دلیل ضریب وقفه، تغییر زمینه است: یک وقفه می تواند منجر به از دست دادن حداقل 20 دقیقه به دلیل از دست دادن تمرکز و تغییر زمینه شود. این احتمال وجود دارد که تیم‌های شما منابع دیگری از وقفه داشته باشند، مانند بلیط‌های تولید شده توسط تیم‌های دیگر، درخواست‌ها یا سؤالات از طریق چت و/یا ایمیل. بسته به حجم این وقفه‌های دیگر، می‌توانید در حین انجام وظیفه آنها را به چرخش موجود اضافه کنید یا چرخش دوم را فقط برای رسیدگی به این درخواست‌های دیگر تنظیم کنید.

هنگام برنامه ریزی کاری که تیم انجام خواهد داد، چه بلند مدت و چه کوتاه مدت، مهم است که این را در نظر بگیرید. اگر تیم شما تمایل به شیفت کاری نسبتاً شدید دارد، این واقعیت باید در برنامه ریزی بلندمدت در نظر گرفته شود، زیرا ممکن است موقعیتی داشته باشید که در آن کل کارکنان به طور موثر در هر زمان معین به جای انجام کارهای دیگر در حال انجام وظیفه باشند. در برنامه‌ریزی کوتاه‌مدت، ممکن است متوجه شوید که فرد متصدی به دلیل مسئولیت‌های خود نمی‌تواند ضرب‌الاجل‌ها را رعایت کند. انجام می شود و فرد در حال تماس در وظایف کاری خود پشتیبانی می شود. صرف نظر از اینکه آیا فرد آماده خدمت فراخوانده می شود یا خیر، شیفت کاری بر توانایی فرد آماده خدمت برای انجام کارهای دیگر تأثیر می گذارد - انتظار نداشته باشید که فرد آماده خدمت علاوه بر انجام پروژه های برنامه ریزی شده، شب ها نیز کار کند. در حال انجام وظیفه بعد از ساعت کاری

تیم ها باید راهی برای مقابله با کار اضافی ایجاد شده در حین انجام وظیفه پیدا کنند. این کار می تواند کار واقعی برای رفع مشکلات واقعی شناسایی شده توسط سیستم های نظارت و هشدار باشد، یا می تواند کاری برای رفع نظارت و هشدار برای کاهش تعداد هشدارهای مثبت کاذب باشد. ماهیت کار در حال ایجاد هرچه که باشد، توزیع عادلانه و پایدار آن کار در تیم مهم است. همه شیفت های نوبت کاری یکسان ایجاد نمی شوند و برخی از آنها پیچیده تر از سایرین هستند، بنابراین بیان اینکه فردی که هشدار را دریافت می کند، مسئول رسیدگی به تمام عواقب آن هشدار است، می تواند منجر به توزیع نابرابر کار شود. ممکن است منطقی تر باشد که فرد وظیفه مسئول برنامه ریزی یا توزیع کار باشد، با این انتظار که بقیه اعضای تیم مایل به کمک به تکمیل کار ایجاد شده باشند.

ایجاد و حفظ تعادل بین کار و زندگی

به تأثیری که انجام وظیفه بر زندگی شما خارج از محل کار می گذارد فکر کنید. هنگامی که در حال انجام وظیفه هستید، احتمالاً احساس می کنید که به تلفن همراه و لپ تاپ خود وابسته هستید، به این معنی که همیشه یک لپ تاپ و یک روتر موبایل (مودم usb) همراه خود دارید یا به سادگی از خانه / محل کار خود خارج نمی شوید. در نوبت بودن معمولاً به معنای کنار گذاشتن چیزهایی مانند دیدن دوستان یا خانواده در طول شیفت کاری است. این به این معنی است که طول هر شیفت به تعداد افراد تیم شما بستگی دارد و دفعات نوبت ها می تواند بار نامناسبی را بر دوش افراد وارد کند. ممکن است لازم باشد مدت و زمان شیفت های خود را آزمایش کنید تا برنامه ای را بیابید که حداقل برای اکثر افراد درگیر کار کند، زیرا تیم ها و افراد مختلف اولویت ها و ترجیحات متفاوتی خواهند داشت.

تشخیص تأثیری که انجام وظیفه بر زندگی مردم خواهد داشت، چه در سطح مدیریت و چه در سطح فردی، حیاتی است. لازم به ذکر است که تأثیر نامتناسب توسط افراد دارای امتیاز کمتر احساس خواهد شد. به عنوان مثال، اگر مجبور هستید برای مراقبت از کودکان یا سایر اعضای خانواده وقت بگذارید، یا اگر متوجه شدید که بیشتر کارهای خانه بر دوش شماست، در حال حاضر زمان و انرژی کمتری نسبت به کسی که این کار را نمی کند، دارید. این نوع کار «شیفت دوم» یا «شیفت سوم» به طور نامتناسبی بر افراد تأثیر می‌گذارد، و اگر چرخش‌های حین تماس را با زمان‌بندی یا شدتی ایجاد کنید که فرض می‌کند شرکت‌کنندگان زندگی شخصی خارج از دفتر ندارند، افرادی را محدود می‌کنید که می تواند در تیم شما شرکت کند.

افراد را تشویق کنید تا سعی کنند بیشتر برنامه منظم خود را حفظ کنند. باید به این تیم روترهای موبایل (مودم‌های USB) بدهید تا مردم بتوانند با لپ‌تاپ خود خانه را ترک کنند و همچنان ظاهری شبیه به زندگی داشته باشند. افراد را تشویق کنید تا در صورت لزوم، در مدت زمان کوتاهی ساعات کاری را با یکدیگر معاوضه کنند تا افراد بتوانند در حین انجام وظیفه به باشگاه بروند یا به پزشک مراجعه کنند. فرهنگی را ایجاد نکنید که در آن آماده بودن به معنای واقعی کلمه مهندسان کاری جز آماده بودن انجام نمی دهند. تعادل بین کار و زندگی بخش مهمی از هر شغلی است، اما به خصوص زمانی که شما ساعات خارج از کار را در نظر می گیرید، اعضای ارشد تیم شما باید تا حد امکان در حین انجام وظیفه، از نظر تعادل بین کار و زندگی الگوی دیگران باشند.

در سطح فردی، فراموش نکنید که انجام وظیفه برای دوستان، خانواده، شریک زندگی، حیوانات خانگی و غیره چه معنایی دارد (احتمالاً گربه‌های شما اهمیتی نمی‌دهند، زیرا وقتی هشدار را دریافت می‌کنید ساعت 4 صبح بیدار هستند. ، اگرچه آنها به هیچ وجه نمی خواهند به شما در حل آن کمک کنند). مطمئن شوید که زمان از دست رفته را پس از پایان شیفت خود جبران می کنید، مثلاً برای دیدن دوستان، خانواده یا خوابیدن. اگر می‌توانید، یک زنگ بی‌صدا (مانند ساعت هوشمند) تنظیم کنید که می‌تواند شما را با وزوز مچ بیدار کند تا اطرافیانتان را بیدار نکنید. وقتی در میانه نوبت کاری خود هستید و وقتی تمام می شود، راه هایی برای مراقبت از خود پیدا کنید. ممکن است بخواهید یک "کیت زنده ماندن در حین تماس" تهیه کنید که به شما کمک می کند آرامش داشته باشید: به لیست پخش موسیقی مورد علاقه خود گوش دهید، کتاب مورد علاقه خود را بخوانید یا زمانی را برای بازی با حیوان خانگی خود اختصاص دهید. مدیران باید با دادن یک روز مرخصی به افراد پس از یک هفته کار و اطمینان از درخواست (و دریافت) کمک در صورت نیاز، خودمراقبتی را تشویق کنند.

بهبود تجربه وظیفه

به طور کلی، انجام وظیفه نباید فقط به عنوان یک شغل وحشتناک تلقی شود: شما به عنوان یک فرد وظیفه این فرصت و مسئولیت را دارید که فعالانه کار کنید تا این کار را برای افرادی که در آینده در حال انجام وظیفه هستند، بهتر کنید، به این معنی که مردم پیام های کمتری دریافت خواهند کرد و دقیق تر خواهند بود. باز هم، ردیابی ارزش هشدارهای خود با استفاده از چیزی مانند Opsweekly می تواند به شما کمک کند تا بفهمید چه چیزی باعث آزاردهنده تماس شما می شود و آن را برطرف کنید. برای هشدارهای غیرفعال، از خود بپرسید که آیا راه‌هایی برای خلاص شدن از شر این هشدارها وجود دارد - شاید این بدان معناست که آنها فقط در ساعات کاری خاموش می‌شوند، زیرا برخی چیزها وجود دارد که نیازی نیست در نیمه‌شب به آنها پاسخ دهید. از حذف هشدارها، تغییر آنها یا تغییر روش ارسال از «ارسال به تلفن و ایمیل» به «فقط ایمیل» نترسید. آزمایش و تکرار کلید بهبود وظیفه در طول زمان است.

برای هشدارهایی که واقعاً قابل اجرا هستند، باید در نظر داشته باشید که انجام اقدامات لازم برای یک مهندس چقدر آسان است. هر هشدار در حال اجرا باید یک runbook همراه با خود داشته باشد - استفاده از ابزاری مانند nagios-herald را برای اضافه کردن لینک های runbook به هشدارهای خود در نظر بگیرید. اگر هشدار به اندازه‌ای ساده باشد که نیازی به runbook نداشته باشد، احتمالاً به اندازه کافی ساده است که می‌توانید با استفاده از چیزی مانند کنترل‌کننده‌های رویداد Nagios، پاسخ را خودکار کنید، که باعث می‌شود افراد مجبور نباشند بیدار شوند یا خودشان را برای کارهایی که به راحتی خودکار می‌شوند، قطع کنند. هم runbooks و هم nagios-herald می‌توانند به شما کمک کنند تا زمینه‌های ارزشمندی را به هشدارهای خود اضافه کنید، که به مردم کمک می‌کند به طور مؤثرتری به آنها پاسخ دهند. ببینید آیا می‌توانید به سؤالات رایج مانند: آخرین باری که این هشدار خاموش شد، پاسخ دهید؟ آخرین بار چه کسی به آن پاسخ داد و در نهایت چه اقداماتی انجام دادند (در صورت وجود)؟ چه هشدارهای دیگری همزمان با این نمایش داده می شود و آیا مرتبط هستند؟ این نوع اطلاعات متنی اغلب فقط در مغز افراد ختم می شود، بنابراین تشویق فرهنگ مستندسازی و به اشتراک گذاری اطلاعات متنی می تواند میزان سربار مورد نیاز برای پاسخ به هشدارها را کاهش دهد.

بخش بزرگی از خستگی ناشی از حین تماس‌ها این است که هرگز پایان نمی‌یابند—اگر تیم شما در حال تماس باشد، بعید است که در آینده‌ای قابل پیش‌بینی پایان یابد. جابجایی ها هرگز پایان نمی یابند و ممکن است احساس کنیم که همیشه وحشتناک خواهند بود. این عدم امید یک مسئله ذهنی بزرگ است که می تواند به استرس و خستگی کمک کند، بنابراین پرداختن به این تصور (علاوه بر واقعیت) که وظیفه همیشه وحشتناک خواهد بود، مکان خوبی برای شروع به فکر کردن در مورد وظیفه خود در دراز مدت است.

برای اینکه مردم را امیدوار کنیم که وضعیت کشیک روزی بهبود یابد، لازم است که سیستم قابل مشاهده باشد (همان ردیابی و طبقه بندی وظیفه که قبلاً ذکر کردم). تعداد هشدارهای خود را پیگیری کنید، چند درصد از آنها به مداخله همراه نیاز دارند، چه تعداد از آنها افراد را از خواب بیدار می کنند و سپس برای ایجاد فرهنگی تلاش کنید که مردم را تشویق به انجام بهتر کارها کند. اگر تیم بزرگی دارید، می‌تواند وسوسه‌انگیز باشد، به‌محض اینکه ساعتتان تمام شد، دست‌هایتان را بالا بیاورید و بگویید «این مشکل افسر وظیفه آینده است» به‌جای اینکه برای رفع مشکل تلاش کنید - چه کسی می‌خواهد بیشتر خرج کند. تلاش در وظیفه از آنها مورد نیاز است؟ اینجاست که فرهنگ همدلی می‌تواند تفاوت بزرگی ایجاد کند، زیرا شما نه تنها به فکر رفاه خود در حین انجام وظیفه هستید، بلکه به فکر همکارانتان نیز هستید.

همه چیز در مورد همدلی است

همدلی بخش مهمی از چیزی است که به ما امکان می‌دهد عملکردی را افزایش دهیم که تجربه تماس را بهبود می‌بخشد. به‌عنوان مدیر یا عضو، می‌توانید افراد را به‌خاطر رفتاری که تغییر را بهتر می‌کند ارزیابی مثبت یا حتی پاداش دهید. پشتیبانی عملیات یکی از حوزه‌هایی است که مهندسان اغلب احساس می‌کنند که مردم فقط زمانی که مشکلی پیش می‌آید به آن‌ها توجه می‌کنند: وقتی یک سایت خراب می‌شود، مردم آنجا هستند تا سر آنها فریاد بزنند، اما به ندرت در مورد تلاش‌های پشت صحنه عملیات یاد می‌کنند. مهندسان تلاش می کنند تا سایت را در بقیه زمان ها فعال نگه دارند. تشخیص کار می‌تواند بسیار کمک کند، چه تشکر از شخصی در یک جلسه یا در یک ایمیل کلی برای بهبود یک هشدار خاص، یک جنبه فنی در حال انجام وظیفه، یا دادن زمان به کسی که برای مدتی برای مهندس دیگری در شیفت پوشش دهد.

افراد را تشویق کنید تا زمان و تلاش خود را برای بهبود وضعیت درازمدت خود صرف کنند. اگر تیم شما آماده خدمت است، باید این کار را به همان روشی که هر کار دیگری در نقشه راه خود انجام می دهید، برنامه ریزی و اولویت بندی کنید. تماس‌ها 90 درصد آنتروپی هستند و اگر فعالانه برای بهبود آنها تلاش نکنید، به مرور بدتر و بدتر می‌شوند. با تیم خود کار کنید تا بفهمید چه چیزی به مردم انگیزه می دهد و به آنها پاداش می دهد، و سپس از آن برای تشویق مردم برای کاهش صدای هشدار، نوشتن کتابچه ها و ایجاد ابزارهایی استفاده کنید که مشکلات حین تماس آنها را حل کند. هر کاری که انجام می دهید، به وظیفه وحشتناک به عنوان بخشی دائمی از وضعیت کار رضایت ندهید.

منبع: www.habr.com

اضافه کردن نظر