我們如何改變始終連接的狀態以防止倦怠

文章的翻譯是專門為課程的學生準備的 “DevOps 實踐和工具”.

我們如何改變始終連接的狀態以防止倦怠

Intercom 的使命是讓在線業務個性化。 但當產品不工作時,就不可能對其進行個性化。 如何。 正常運行時間對於我們業務的成功至關重要,不僅因為我們的客戶付錢給我們,還因為我們使用 與您的產品。 如果我們的服務不起作用,我們確實會感受到客戶的痛苦。

不間斷運行取決於很多因素,例如軟件架構和日常工作質量。 然而,通常情況下,這取決於這樣一個事實:始終保持聯繫的人接聽電話 PagerDuty。 這種技術支持可以是一種以客戶為中心的強大工具,它將工程師的幫助與客戶在購買您的產品時獲得的幫助結合起來。 它還為學習和成長提供了絕佳的機會,因為畢竟失敗和錯誤可以成為練習技能和理解複雜工作機制的良好領域。

在工作時間之外保持“始終聯繫”對您的生活有害。

但與此同時,“始終保持聯繫”可能會對您的生活產生不利影響。 您必須準備好快速、有效地響應出現問題的通知。 即使在那個特定時刻你沒有被尋呼機呼叫,“永遠在線”的狀態也會給你帶來一種不安的感覺,我自己從個人經驗中知道這一點。 特別是因此,睡眠質量惡化。 一天中的任何時間經常處於訪問區域可能會導致倦怠、冷漠,或者一般來說,導致再也見不到計算機的願望。

Intercom 中“始終連接”狀態的歷史記錄

在 Intercom 的早期階段,我們的首席技術官 Ciaran 獨自一人負責整個 XNUMX/XNUMX 技術支持團隊,無論是在辦公室還是在辦公室外。 隨著 Intercom 的發展,成立了一個特別工作組來協助 Ciaran。 此後不久,新的開發團隊開始創建許多新功能和服務,並且他們已經接管了所有技術支持職責。

任何時候都有太多人“在線”。

當時,這種方法似乎是理所當然的,因為這是在任何特定時刻擴展我們的技術支持團隊的簡單方法,它符合我們的價值觀,並且讓我們感到滿意 主人翁意識。 結果,在沒有任何計劃的情況下,我們最終有四五個團隊在非工作時間定期聯繫客戶。 其餘的開發團隊沒有太多可能引發錯誤的困難點,因此他們很少(如果有的話)被調用。

我們意識到,我們擁有值得自豪的技術支持機制以及我們想要解決的一些關鍵問題,例如:

  • 在任何特定時間,都有太多的人準備好接受挑戰。 我們的基礎設施不夠大,不足以需要至少五名開發工程師在沒有正常休息日的情況下工作。
  • 我們的警報和呼叫程序的質量在各個團隊中並不一致,我們對新的和現有的問題警報使用了臨時審查流程。 運行手冊中的指示(提出問題時應遵循的指示)大多因缺失而引人注目。
  • 根據工程師所工作的團隊的不同,他們的期望是相互矛盾的。 例如,只有第一個技術支持團隊才能獲得輪班和假期中斷的補償。
  • 事實證明,對於非正常時間不必要的通話,人們普遍存在一定程度的容忍度。
  • 最後,這種工作並不適合所有人。 生活情況有時表明,輪班並不能以最好的方式影響人們。

找到“始終連接”的正確狀態

我們決定創建一個新的虛擬團隊,在每個團隊下班時間進行技術支持工作。 該團隊將由志願者組成,而不是組織中任何團隊的應徵入伍者。 虛擬團隊的工程師大約每六個月輪換一次,花費數週的時間“保持聯繫”。 幸運的是,我們毫無問題地找到了足夠的志願者來組建一個虛擬團隊。

結果,我們的支持團隊從 30 人減少到只有 6 或 7 人。

然後,團隊商定並定義了問題警報和操作手冊描述應是什麼樣子,並概述了將警報轉發給新支持團隊的流程。 他們使用 Terraform 模塊識別了代碼中的所有警報,並開始對每個更改進行同行評審。 我們推出了非常適合值班人員的每週輪班補償水平。 我們還創建了一個升級的二級團隊,其中僅由經理組成。 該命令應該是技術支持工程師的單點升級。

我們花了幾個月的時間才建立了這個流程,結果現在保持聯繫的工程師不再是以前的30個,而是只有6、7個。在工作時間,團隊獨立處理他們的功能或服務的問題,這段時間通常出現故障的次數最多,但其餘時間則由志願者提供技術支持。

我們學到了什麼

在我們啟動虛擬技術支持團隊後,我們預計會出現大量新任務,例如調查問題原因或召開全體會議來解決導致崩潰的單個問題。 然而,我們的開發團隊對導致崩潰的因素承擔全部責任,任何後續響應通常都是立即採取行動。 我們還需要避免出現技術諮詢任務被退回到原來團隊的情況,以免迫使工程師在下班後繼續聯繫。

工作時間以外的電話已減少至每月 10 次以下。

從形式上來說,我們的升級流程很少被使用。 更常見的看法是,工程師得到了當前在線團隊的非正式協助,尤其是我們舊金山辦公室的人員。 通過團隊合作和即時解決,許多問題已得到解決或減少。

我們舊金山辦事處的工程師作為一個完整的團隊加入該團隊,並提供超出常規技術支持的服務。 雖然涉及一些管理費用,但在多個地點擴大支持團隊成員數量對我們有利,因為事實證明,這是建立、加強關係並更多地了解我們所使用的技術堆棧的好方法。

在我們的團隊中,對講開發人員的工作變得更加一致,我們可以在我們的網站上自信地談論系統工程師職位的好處 加入我們,表示如果您自己不願意,則無需始終保持聯繫。

除了穩定和擴展數據倉庫的基礎工作外,對解決問題的持續關注已將非工作時間的呼叫減少到每月不到 10 個。 我們對這個數字感到非常自豪。

我們繼續致力於維護和改進我們的技術支持團隊,隨著 Intercom 的發展,我們可能需要重新考慮我們的決定,因為今天有效的方法可能不一定在下次我們的員工人數翻倍時有效。 然而,這種經歷對我們的組織來說非常積極,極大地提高了我們開發工程師的生活質量、我們應對挑戰的質量,最重要的是,提高了我們客戶的體驗。

來源: www.habr.com

添加評論