Perkara yang perlu difikirkan semasa melaksanakan anjakan tugas

Pengarang DevOps yang berkesan Ryn Daniels berkongsi strategi yang boleh digunakan oleh sesiapa sahaja untuk mencipta putaran Oncall yang lebih baik, kurang mengecewakan dan lebih mampan.

Perkara yang perlu difikirkan semasa melaksanakan anjakan tugas

Dengan kemunculan Devops, ramai jurutera hari ini menganjurkan syif dalam satu cara atau yang lain, yang pernah menjadi tanggungjawab tunggal sysadmin atau jurutera operasi. Bertugas, terutamanya pada waktu tidak bekerja, bukanlah tugas yang digemari kebanyakan orang. Tugas oncall boleh mengganggu tidur kita, mengganggu kerja biasa yang kita cuba lakukan pada siang hari, dan mengganggu kehidupan kita secara umum. Apabila semakin banyak pasukan mengambil bahagian dalam berjaga-jaga, kami bertanya soalan, "Apakah yang boleh kami lakukan sebagai individu, pasukan dan organisasi untuk menjadikan berjaga-jaga lebih berperikemanusiaan dan mampan?"

Simpan tidur anda

Selalunya perkara pertama yang difikirkan orang apabila mereka berfikir tentang bertugas ialah ia akan menjejaskan tidur mereka secara negatif; tiada siapa yang mahukan amaran untuk membangunkan mereka di tengah malam. Jika organisasi atau pasukan anda cukup besar, anda boleh menggunakan putaran "ikut matahari", di mana pasukan dalam berbilang zon waktu mengambil bahagian dalam putaran yang sama, dengan syif tugas yang lebih pendek. jadi setiap zon waktu hanya akan bertugas semasa perniagaannya (atau sekurang-kurangnya bangun) jam. Mewujudkan putaran sedemikian boleh melakukan keajaiban untuk mengurangkan beban kerja malam yang ditanggung oleh atendan.

Jika anda tidak mempunyai jurutera dan pengedaran geografi yang mencukupi untuk menyokong putaran mengikut matahari, masih terdapat perkara yang boleh anda lakukan untuk mengurangkan kemungkinan orang terjaga secara tidak perlu di tengah malam. Lagipun, adalah satu perkara untuk bangun dari katil pada pukul 4 pagi untuk menyelesaikan masalah yang mendesak dan dihadapi pelanggan; Ia agak lain untuk bangun hanya untuk mendapati bahawa anda sedang berhadapan dengan penggera palsu. Ia boleh membantu untuk menyemak semua makluman yang telah anda sediakan dan bertanya kepada pasukan anda yang mana yang sebenarnya diperlukan untuk membangunkan seseorang selepas waktu bekerja dan sama ada makluman tersebut boleh menunggu sehingga pagi. Sukar untuk membuat orang bersetuju untuk mematikan beberapa makluman tidak berfungsi, terutamanya jika isu terlepas telah menyebabkan masalah pada masa lalu, tetapi penting untuk diingat bahawa jurutera yang kurang tidur bukanlah jurutera yang paling berkesan. Tetapkan makluman ini semasa waktu perniagaan apabila ia benar-benar penting. Kebanyakan alat amaran hari ini membolehkan anda menyediakan peraturan yang berbeza untuk pemberitahuan selepas waktu kerja, sama ada tempoh pemberitahuan Nagios atau menyediakan jadual yang berbeza dalam PagerDuty.

Tidur, tugas dan budaya pasukan

Penyelesaian lain untuk gangguan tidur melibatkan perubahan budaya yang lebih besar. Satu cara untuk menyelesaikan masalah ini adalah dengan memantau makluman, memberi perhatian khusus apabila ia tiba dan sama ada ia boleh diambil tindakan. Opsweekly ialah alat yang dicipta dan diterbitkan oleh Etsy yang membolehkan pasukan menjejak dan mengkategorikan makluman yang mereka terima. Ia boleh menjana graf yang menunjukkan bilangan makluman membangunkan orang (menggunakan data tidur daripada penjejak kecergasan), serta bilangan makluman yang sebenarnya memerlukan tindakan manusia. Dengan menggunakan teknologi ini, anda boleh menjejaki keberkesanan putaran atas panggilan anda dan kesannya terhadap tidur dari semasa ke semasa.

Pasukan boleh memainkan peranan dalam memastikan setiap orang yang bertugas mendapat rehat yang secukupnya. Wujudkan budaya yang menggalakkan orang ramai menjaga diri sendiri: jika anda kurang tidur kerana dipanggil pada waktu malam, anda boleh tidur lebih lama pada waktu pagi untuk cuba menebus masa tidur yang hilang. Ahli pasukan boleh melihat antara satu sama lain: Apabila pasukan berkongsi data tidur mereka antara satu sama lain melalui sesuatu seperti Opsweekly, mereka boleh pergi kepada rakan sekerja mereka yang bertugas dan berkata, "Hei, nampaknya anda mengalami malam yang sukar dengan PagerDuty malam tadi." "Adakah anda mahu saya melindungi anda malam ini supaya anda boleh berehat?" Galakkan orang ramai untuk menyokong satu sama lain dengan cara ini dan tidak menggalakkan "budaya wira" di mana orang akan memaksa diri mereka ke had dan mengelak daripada meminta bantuan.

Mengurangkan kesan bertugas di tempat kerja

Apabila jurutera keletihan kerana mereka dikejutkan semasa bertugas, mereka jelas tidak akan bekerja pada kapasiti 100% untuk hari itu, tetapi walaupun tanpa mengambil kira kekurangan tidur, bertugas juga boleh memberi kesan lain pada kerja. Salah satu kerugian paling ketara semasa bertugas adalah disebabkan oleh faktor gangguan, perubahan konteks: satu gangguan boleh mengakibatkan kehilangan sekurang-kurangnya 20 minit akibat kehilangan fokus dan penukaran konteks. Kemungkinan besar pasukan anda akan mempunyai sumber gangguan lain, seperti tiket yang dijana oleh pasukan lain, permintaan atau soalan yang datang melalui sembang dan/atau e-mel. Bergantung pada kelantangan gangguan lain ini, anda boleh mempertimbangkan untuk menambahkannya pada giliran sedia ada semasa bertugas atau menyediakan giliran kedua hanya untuk mengendalikan permintaan lain ini.

Adalah penting untuk mengambil kira perkara ini apabila anda merancang kerja yang akan dilakukan oleh pasukan, kedua-dua jangka panjang dan jangka pendek. Jika pasukan anda cenderung mempunyai peralihan tugas yang agak sengit, fakta ini perlu diambil kira dalam perancangan jangka panjang, kerana anda mungkin mempunyai situasi di mana keseluruhan kakitangan bertugas dengan berkesan pada bila-bila masa, dan bukannya melakukan kerja lain. Dalam perancangan jangka pendek, anda mungkin mendapati bahawa orang yang sedang dipanggil tidak dapat memenuhi tarikh akhir kerana tanggungjawab semasa panggilan mereka - ini harus dijangkakan dan seluruh pasukan harus bersedia untuk menampung dan membantu untuk memastikan kerja itu selesai dan orang atas panggilan disokong dalam tugas kerja mereka. Tidak kira sama ada orang atas panggilan dipanggil masuk, syif atas panggilan akan memberi kesan kepada keupayaan orang atas panggilan untuk melaksanakan kerja lainβ€”jangan mengharapkan orang yang sedang memanggil itu bekerja pada waktu malam untuk menyelesaikan projek yang dijadualkan selain daripada menjadi bertugas selepas waktu kerja.

Pasukan perlu mencari cara untuk mengatasi kerja tambahan yang dihasilkan semasa bertugas. Kerja ini boleh menjadi kerja sebenar untuk menyelesaikan masalah sebenar yang dikesan oleh sistem pemantauan dan amaran, atau ia boleh menjadi kerja untuk membetulkan pemantauan dan makluman untuk mengurangkan bilangan makluman positif palsu. Walau apa pun jenis kerja yang dicipta, adalah penting untuk mengagihkan kerja itu secara adil dan mampan ke seluruh pasukan. Tidak semua anjakan semasa panggilan dibuat sama, dan sesetengahnya lebih kompleks daripada yang lain, jadi menyatakan bahawa orang yang menerima amaran adalah orang yang bertanggungjawab untuk menangani semua akibat amaran itu boleh membawa kepada pengagihan kerja yang tidak sekata. Mungkin lebih masuk akal bagi orang yang bertugas untuk bertanggungjawab untuk menjadualkan atau mengagihkan kerja, dengan jangkaan bahawa seluruh pasukan akan bersedia membantu menyelesaikan kerja yang dibuat.

Mencipta dan mengekalkan keseimbangan kerja-kehidupan

Fikirkan tentang kesan semasa bertugas terhadap kehidupan anda di luar kerja. Apabila anda sedang bertugas, anda berkemungkinan akan merasa terikat dengan telefon bimbit dan komputer riba anda, ini bermakna anda sentiasa membawa komputer riba dan penghala mudah alih (modem usb) bersama anda atau langsung tidak meninggalkan rumah/pejabat anda. Berada dalam panggilan biasanya bermakna melepaskan perkara seperti berjumpa rakan atau keluarga semasa syif anda. Ini bermakna tempoh setiap syif bergantung pada bilangan orang dalam pasukan anda, dan kekerapan syif boleh memberi beban yang tidak wajar kepada orang. Anda mungkin perlu mencuba tempoh dan masa peralihan anda untuk mencari jadual yang sesuai untuk sekurang-kurangnya majoriti orang yang terlibat, kerana pasukan dan orang yang berbeza akan mempunyai keutamaan dan keutamaan yang berbeza.

Adalah penting untuk mengiktiraf impak yang akan ada pada kehidupan orang ramai, baik di peringkat pengurusan mahupun di peringkat individu. Perlu diingatkan bahawa kesannya akan dirasai secara tidak seimbang oleh orang yang kurang keistimewaan. Contohnya, jika anda terpaksa meluangkan masa menjaga anak atau ahli keluarga yang lain, atau jika anda mendapati kebanyakan kerja rumah jatuh ke bahu anda, anda sudah mempunyai lebih sedikit masa dan tenaga berbanding seseorang yang tidak mempunyai tanggungjawab. Kerja jenis "anjakan kedua" atau "anjakan ketiga" ini cenderung memberi kesan yang tidak seimbang kepada orang ramai, dan jika anda membuat penggiliran atas panggilan dengan jadual atau intensiti yang menganggap peserta tidak mempunyai kehidupan peribadi di luar pejabat, anda mengehadkan orang yang boleh mengambil bahagian dalam pasukan anda.

Galakkan orang ramai untuk cuba mengekalkan lebih banyak jadual tetap mereka. Anda harus mempertimbangkan untuk menyediakan pasukan penghala mudah alih (modem usb) supaya orang ramai boleh meninggalkan rumah dengan komputer riba mereka dan masih mempunyai sedikit kemiripan kehidupan. Galakkan orang ramai untuk berdagang waktu panggilan antara satu sama lain, jika perlu, untuk jangka masa yang singkat supaya orang ramai boleh pergi ke gim atau berjumpa doktor semasa bertugas. Jangan wujudkan budaya di mana berada dalam panggilan bermakna jurutera benar-benar melakukan apa-apa selain sentiasa bersedia. Keseimbangan kerja-kehidupan adalah bahagian penting dalam mana-mana pekerjaan, tetapi terutamanya apabila anda mempertimbangkan waktu luar tugas, lebih ramai ahli senior dalam pasukan anda harus menunjukkan contoh kepada orang lain dari segi keseimbangan kehidupan kerja, sebaik mungkin semasa bertugas.

Pada peringkat individu, jangan lupa untuk menerangkan maksud bertugas kepada rakan, keluarga, rakan kongsi, haiwan peliharaan, dll. (kucing anda mungkin tidak akan peduli kerana mereka sudah bangun pada pukul 4 pagi apabila anda mendapat makluman , walaupun mereka tidak akan mahu membantu anda menyelesaikannya). Pastikan anda menebus masa yang hilang selepas syif anda tamat, sama ada untuk berjumpa rakan, keluarga atau tidur, contohnya. Jika boleh, pertimbangkan untuk menyediakan penggera senyap (seperti jam tangan pintar) yang boleh membangunkan anda dengan mendengung pergelangan tangan anda supaya anda tidak membangunkan sesiapa di sekeliling anda. Cari cara untuk menjaga diri anda apabila anda berada di tengah-tengah syif semasa panggilan anda dan apabila selesai. Anda mungkin mahu mengumpulkan "kit survival on-call" yang akan membantu anda berehat: mendengar senarai main muzik kegemaran anda, membaca buku kegemaran anda atau meluangkan masa untuk bermain dengan haiwan kesayangan anda. Pengurus harus menggalakkan penjagaan diri dengan memberi orang cuti sehari selepas seminggu bertugas dan memastikan orang ramai meminta (dan mendapatkan) bantuan apabila mereka memerlukannya.

Meningkatkan pengalaman bertugas

Secara keseluruhan, bertugas bukan sahaja dilihat sebagai pekerjaan yang mengerikan: anda mempunyai peluang dan tanggungjawab sebagai orang yang bertugas untuk bekerja secara aktif untuk menjadikannya lebih baik untuk orang yang akan bertugas pada masa hadapan, yang bermaksud bahawa orang akan menerima lebih sedikit mesej dan ia akan menjadi lebih tepat. Sekali lagi, menjejaki nilai makluman anda menggunakan sesuatu seperti Opsweekly boleh membantu anda mengetahui perkara yang membuat panggilan anda menjengkelkan dan membetulkannya. Untuk makluman yang tidak aktif, tanya diri anda sama ada terdapat cara untuk menyingkirkan makluman ini - mungkin ini bermakna ia hanya akan dimatikan semasa waktu perniagaan, kerana terdapat beberapa perkara yang anda tidak perlu balas pada tengah malam. Jangan takut untuk memadam makluman, menukarnya atau menukar kaedah penghantaran daripada "hantar ke telefon dan e-mel" kepada "e-mel sahaja." Percubaan dan lelaran adalah kunci untuk meningkatkan tugas dari semasa ke semasa.

Untuk makluman yang sebenarnya boleh diambil tindakan, anda harus mempertimbangkan betapa mudahnya seorang jurutera mengambil tindakan yang perlu. Setiap amaran yang sedang berjalan harus mempunyai buku jalan yang disertakan dengannya - pertimbangkan untuk menggunakan alat seperti nagios-herald untuk menambah pautan buku jalanan pada makluman anda. Jika makluman itu cukup mudah sehingga tidak memerlukan buku jalanan, mungkin cukup mudah untuk anda boleh mengautomasikan respons menggunakan sesuatu seperti pengendali acara Nagios, yang menjimatkan orang terpaksa bangun atau mengganggu diri mereka sendiri untuk tugasan automatik yang mudah. Kedua-dua buku panduan dan nagios-herald boleh membantu anda menambah konteks berharga pada makluman anda, yang akan membantu orang ramai bertindak balas terhadapnya dengan lebih berkesan. Lihat sama ada anda boleh menjawab soalan biasa seperti: Bilakah kali terakhir amaran ini berbunyi? Siapa yang menjawabnya kali terakhir, dan apakah tindakan yang akhirnya mereka ambil (jika ada)? Apakah makluman lain yang muncul pada masa yang sama dengan ini dan adakah ia berkaitan? Jenis maklumat kontekstual ini selalunya berakhir hanya dalam otak orang, jadi menggalakkan budaya mendokumentasikan dan berkongsi maklumat kontekstual boleh mengurangkan jumlah overhed yang diperlukan untuk bertindak balas kepada makluman.

Sebahagian besar keletihan yang datang daripada panggilan adalah bahawa mereka tidak pernah berakhirβ€”jika pasukan anda mempunyai panggilan, tidak mungkin mereka akan tamat pada bila-bila masa pada masa hadapan. Peralihan tidak pernah berakhir, dan kita mungkin merasakan ia akan sentiasa mengerikan. Kekurangan harapan ini adalah isu mental yang besar yang boleh menyumbang kepada tekanan dan keletihan, jadi menangani persepsi (sebagai tambahan kepada realiti) bahawa tugas akan sentiasa mengerikan adalah tempat yang baik untuk mula memikirkan tugas anda dalam jangka panjang.

Untuk memberi harapan kepada orang ramai bahawa keadaan bertugas akan bertambah baik, adalah perlu untuk mempunyai sistem yang boleh diperhatikan (pengesan dan pengkategorian tugas yang sama seperti yang saya nyatakan sebelum ini). Jejaki bilangan makluman yang anda ada, berapa peratus daripadanya memerlukan campur tangan atendan, berapa ramai daripadanya membangunkan orang ramai, dan kemudian berusaha untuk mencipta budaya yang menggalakkan orang ramai melakukan perkara yang lebih baik. Jika anda mempunyai pasukan yang besar, ia boleh menggoda, sebaik sahaja jam tangan anda tamat, untuk mengangkat tangan anda dan berkata "itu masalah pegawai bertugas masa depan" daripada memikirkan untuk membetulkan sesuatu - siapa yang mahu berbelanja lebih usaha bertugas daripada daripada mereka yang diperlukan? Di sinilah budaya empati boleh membuat perubahan besar, kerana anda bukan sahaja menjaga kesejahteraan anda semasa bertugas, tetapi juga untuk rakan sekerja anda.

Ini semua tentang empati

Empati ialah bahagian penting yang membolehkan kami memacu prestasi yang meningkatkan pengalaman semasa panggilan. Sebagai pengurus atau ahli, anda boleh menilai secara positif atau malah memberi ganjaran kepada orang untuk tingkah laku yang menjadikan peralihan itu lebih baik. Sokongan operasi ialah salah satu bidang yang jurutera sering merasakan orang hanya memberi perhatian kepada mereka apabila berlaku masalah: orang ramai akan berada di sana untuk menjerit kepada mereka apabila tapak ranap, tetapi mereka jarang mengetahui tentang usaha di sebalik tabir yang beroperasi. jurutera meletakkan untuk memastikan tapak berjalan sepanjang masa. Mengiktiraf kerja boleh memberi manfaat yang besar, sama ada mengucapkan terima kasih kepada seseorang dalam mesyuarat atau dalam e-mel umum kerana memperbaik makluman tertentu, aspek teknikal semasa bertugas atau memberi masa kepada seseorang untuk membuat perlindungan bagi jurutera lain dalam syif buat seketika.

Galakkan orang ramai untuk meluangkan masa dan usaha untuk memperbaiki keadaan semasa panggilan mereka dalam jangka panjang. Jika pasukan anda mempunyai panggilan semasa, anda harus merancang dan mengutamakan kerja ini dengan cara yang sama seperti mana-mana kerja lain pada peta jalan anda. Semasa panggilan adalah 90% entropi, dan melainkan anda berusaha secara aktif untuk memperbaikinya, ia akan menjadi lebih teruk dari semasa ke semasa. Bekerjasama dengan pasukan anda untuk mengetahui perkara terbaik yang mendorong dan memberi ganjaran kepada orang ramai, kemudian gunakannya untuk menggalakkan orang ramai mengurangkan hingar amaran, menulis buku jalanan dan mencipta alatan yang menyelesaikan masalah semasa panggilan mereka. Apa sahaja yang anda lakukan, jangan berpuas hati dengan tugas yang teruk sebagai bahagian tetap dalam keadaan.

Sumber: www.habr.com

Tambah komen