Cách chúng tôi thay đổi trạng thái luôn kết nối để ngăn chặn tình trạng kiệt sức

Bản dịch của bài viết được chuẩn bị riêng cho các học viên của khóa học "Các phương pháp và công cụ DevOps".

Cách chúng tôi thay đổi trạng thái luôn kết nối để ngăn chặn tình trạng kiệt sức

Sứ mệnh của Intercom là cá nhân hóa hoạt động kinh doanh trực tuyến. Nhưng bạn không thể cá nhân hóa một sản phẩm khi nó không hoạt động. làm thế nào để. Hiệu suất rất quan trọng đối với sự thành công trong hoạt động kinh doanh của chúng tôi, không chỉ vì khách hàng trả tiền cho chúng tôi mà còn vì chính chúng tôi sử dụng với sản phẩm của bạn. Nếu dịch vụ của chúng tôi không hoạt động, chúng tôi thực sự cảm nhận được nỗi đau của khách hàng.

Hoạt động trơn tru phụ thuộc vào nhiều yếu tố, chẳng hạn như kiến ​​trúc phần mềm và chất lượng công việc hàng ngày. Tuy nhiên, thường thì tất cả đều bắt nguồn từ thực tế là người luôn giữ liên lạc sẽ trả lời các cuộc gọi từ Máy nhắn tin. Loại hỗ trợ kỹ thuật này có thể là một công cụ mạnh mẽ lấy khách hàng làm trung tâm, kết hợp sự trợ giúp của kỹ sư với những gì khách hàng nhận được khi họ mua sản phẩm của bạn. Đây cũng là cơ hội tuyệt vời để học hỏi và phát triển, bởi suy cho cùng, những thất bại và sai lầm có thể là cơ hội tốt để rèn luyện kỹ năng và hiểu rõ các cơ chế làm việc phức tạp.

Việc “luôn bật” ngoài giờ làm việc có ảnh hưởng bất lợi đến cuộc sống của bạn.

Nhưng đồng thời, việc “luôn bật” có thể gây ảnh hưởng xấu đến cuộc sống của bạn. Bạn phải sẵn sàng phản ứng nhanh chóng và thành thạo khi có cảnh báo rằng có thứ gì đó bị hỏng. Ngay cả khi bạn không được nhắn tin vào bất kỳ thời điểm nào, việc "luôn bật" có thể tạo ra sự lo lắng, như tôi biết từ kinh nghiệm cá nhân. Vì điều này, chất lượng giấc ngủ bị suy giảm đặc biệt nghiêm trọng. Thường xuyên ở trong vùng truy cập vào bất kỳ thời điểm nào trong ngày có thể dẫn đến kiệt sức, thờ ơ hoặc nói chung là mong muốn không bao giờ nhìn thấy máy tính nữa.

Lịch sử trạng thái “luôn kết nối” trong Intercom

Trong những ngày đầu của Intercom, Giám đốc Kỹ thuật của chúng tôi, Ciaran, đã một tay cung cấp toàn bộ đội ngũ hỗ trợ kỹ thuật XNUMX/XNUMX, cả trong và ngoài văn phòng. Khi Intercom phát triển, một đội đặc nhiệm được thành lập để giúp đỡ Ciaran. Ngay sau đó, các nhóm phát triển mới bắt đầu tạo ra nhiều tính năng và dịch vụ mới, đồng thời họ đảm nhận mọi trách nhiệm hỗ trợ kỹ thuật.

Có quá nhiều người “theo yêu cầu” vào bất kỳ thời điểm nào.

Vào thời điểm đó, cách tiếp cận này có vẻ như hiển nhiên vì đây là cách dễ dàng để mở rộng quy mô nhóm hỗ trợ kỹ thuật của chúng tôi ngay lập tức, nó phù hợp với các giá trị của chúng tôi và phù hợp với chúng tôi. ý thức sở hữu. Cuối cùng, không có bất kỳ kế hoạch nào, chúng tôi chỉ có bốn hoặc năm nhóm thường xuyên liên hệ với khách hàng ngoài giờ làm việc của họ. Các nhóm phát triển còn lại không gặp nhiều vấn đề phức tạp có thể gây ra lỗi, vì vậy họ hiếm khi được gọi.

Chúng tôi nhận ra rằng mình đang ở trong tình huống có cơ chế hỗ trợ kỹ thuật mà chúng tôi không thể tự hào và một số vấn đề quan trọng mà chúng tôi muốn khắc phục, chẳng hạn như:

  • Có quá nhiều người sẵn sàng đón nhận thử thách vào bất kỳ thời điểm nào. Cơ sở hạ tầng của chúng tôi không đủ lớn để yêu cầu tối thiểu năm kỹ sư phát triển làm việc không có ngày nghỉ thường xuyên.
  • Chất lượng cảnh báo và quy trình gọi của chúng tôi không nhất quán giữa các nhóm và chúng tôi đã sử dụng các quy trình đặc biệt để xem xét các cảnh báo sự cố mới và hiện có. Các hướng dẫn trong sổ tay (phải tuân theo khi được thông báo về sự cố) hầu hết đều dễ thấy do sự vắng mặt của chúng.
  • Tùy thuộc vào nhóm mà các kỹ sư làm việc, họ có những kỳ vọng trái ngược nhau. Ví dụ: chỉ có nhóm hỗ trợ kỹ thuật đầu tiên mới có bất kỳ khoản thù lao nào cho những ca làm việc theo yêu cầu và những ngày cuối tuần bị gián đoạn.
  • Dường như có một mức độ chấp nhận chung đối với những cuộc gọi không cần thiết vào giờ lẻ.
  • Cuối cùng, loại công việc này không dành cho tất cả mọi người. Hoàn cảnh cuộc sống đôi khi cho thấy sự thay đổi nhiệm vụ không có tác dụng tốt nhất đối với con người.

Tìm đúng trạng thái “luôn bật”

Chúng tôi quyết định tạo một nhóm ảo mới để thực hiện công việc hỗ trợ kỹ thuật cho mỗi nhóm ngoài giờ làm việc. Nhóm sẽ bao gồm các tình nguyện viên, không phải lính nghĩa vụ từ bất kỳ đội nào trong tổ chức. Các kỹ sư trong nhóm ảo luân chuyển khoảng sáu tháng một lần, dành hàng tuần “theo yêu cầu”. May mắn thay, chúng tôi không gặp vấn đề gì khi tìm đủ tình nguyện viên để tập hợp một nhóm ảo.

Kết quả là nhóm hỗ trợ của chúng tôi đã giảm từ 30 người xuống chỉ còn 6 hoặc 7 người.

Sau đó, nhóm đã thống nhất và xác định nội dung mô tả và cảnh báo vấn đề sẽ như thế nào trong sổ tay, đồng thời mô tả quy trình chuyển tiếp cảnh báo đến nhóm hỗ trợ mới. Họ đã xác định tất cả cảnh báo trong mã bằng mô-đun Terraform và bắt đầu sử dụng đánh giá ngang hàng cho mọi thay đổi. Chúng tôi đã đưa ra mức lương cho ca làm việc hàng tuần khiến các nhân viên trực ban khá hài lòng. Chúng tôi cũng đã tạo một nhóm leo thang cấp hai chỉ bao gồm những người quản lý. Nhóm này phải là điểm báo cáo duy nhất cho các kỹ sư hỗ trợ kỹ thuật.

Chúng tôi đã mất nhiều tháng làm việc cật lực để thiết lập quy trình này, kết quả là bây giờ không còn 30 kỹ sư trực như trước mà chỉ có 6 hoặc 7. Trong giờ làm việc, các đội độc lập giải quyết các vấn đề liên quan đến chức năng hoặc chức năng của mình. dịch vụ, trên Đây là thời điểm thường xảy ra nhiều sự cố nhất, nhưng các thời điểm khác, hỗ trợ kỹ thuật đều được cung cấp bởi các tình nguyện viên.

Những gì chúng tôi đã học được

Sau khi ra mắt nhóm hỗ trợ kỹ thuật ảo, chúng tôi mong đợi một loạt nhiệm vụ mới, chẳng hạn như điều tra nguyên nhân của sự cố hoặc tập hợp lại để giải quyết một vấn đề duy nhất gây ra tình trạng ngừng hoạt động. Tuy nhiên, nhóm phát triển của chúng tôi chịu hoàn toàn trách nhiệm về các yếu tố gây ra lỗi và mọi phản hồi sau đó thường diễn ra ngay lập tức. Chúng tôi cũng cần tránh tình huống nhiệm vụ tư vấn kỹ thuật sẽ được gửi lại cho nhóm nơi nó đến, để không buộc các kỹ sư phải liên hệ sau giờ làm việc.

Số lượng cuộc gọi ngoài giờ đã giảm xuống dưới 10 cuộc mỗi tháng.

Quá trình leo thang của chúng tôi hiếm khi được sử dụng một cách chính thức. Một niềm tin phổ biến hơn là kỹ sư này đã được nhóm hiện đang trực tuyến trợ giúp một cách không chính thức, đặc biệt là những người của chúng tôi ở văn phòng San Francisco. Nhiều vấn đề đã được loại bỏ hoặc giảm thiểu thông qua làm việc nhóm và giải quyết chúng một cách nhanh chóng.

Các kỹ sư tại văn phòng San Francisco của chúng tôi đã tham gia nhóm toàn thời gian và vượt xa sự hỗ trợ kỹ thuật thông thường. Chúng tôi đã phải đối mặt với một số chi phí chung, nhưng việc mở rộng thành viên nhóm hỗ trợ của chúng tôi trên nhiều văn phòng đã mang lại lợi ích cho chúng tôi vì nó được chứng minh là một cách tốt để xây dựng mối quan hệ, củng cố mối quan hệ và tìm hiểu thêm về nền tảng công nghệ mà tất cả chúng tôi đều làm việc cùng.

Công việc của các nhà phát triển Intercom đã trở nên nhất quán hơn trong nhóm của chúng tôi và chúng tôi có thể tự tin nói về lợi ích của việc trở thành kỹ sư hệ thống trên trang web của mình Tuyển Dụng, nói rằng không cần phải luôn kết nối trừ khi bạn muốn.

Cùng với công việc cơ bản là ổn định và mở rộng quy mô kho dữ liệu của chúng tôi, việc tiếp tục tập trung vào giải quyết vấn đề đã giúp số lượng cuộc gọi ngoài giờ giảm xuống dưới 10 cuộc gọi mỗi tháng. Chúng tôi rất tự hào về con số này.

Chúng tôi tiếp tục nỗ lực duy trì và cải thiện đội ngũ hỗ trợ kỹ thuật của mình và khi Intercom phát triển, chúng tôi có thể phải xem xét lại các quyết định của mình vì những gì hiệu quả hôm nay không nhất thiết sẽ hiệu quả vào lần tới khi số nhân viên của chúng tôi tăng gấp đôi. Tuy nhiên, trải nghiệm này cực kỳ tích cực đối với tổ chức của chúng tôi và đã cải thiện đáng kể chất lượng cuộc sống của các kỹ sư phát triển, chất lượng phản hồi của chúng tôi đối với các cuộc gọi và trên hết là trải nghiệm của khách hàng.

Nguồn: www.habr.com

Thêm một lời nhận xét