Πώς αλλάξαμε την κατάσταση πάντα συνδεδεμένη για να αποτρέψουμε την εξουθένωση

Η μετάφραση του άρθρου ετοιμάστηκε ειδικά για τους φοιτητές του μαθήματος "Πρακτικές και εργαλεία DevOps".

Πώς αλλάξαμε την κατάσταση πάντα συνδεδεμένη για να αποτρέψουμε την εξουθένωση

Η αποστολή της ενδοεπικοινωνίας είναι να κάνει προσωπικές τις διαδικτυακές επιχειρήσεις. Αλλά είναι αδύνατο να εξατομικεύσετε ένα προϊόν όταν δεν λειτουργεί. πως να. Ο χρόνος λειτουργίας είναι κρίσιμος για την επιτυχία της επιχείρησής μας, όχι μόνο επειδή μας πληρώνουν οι πελάτες μας, αλλά και επειδή χρησιμοποιούμε με το προϊόν σας. Εάν η υπηρεσία μας δεν λειτουργεί, νιώθουμε κυριολεκτικά τον πόνο των πελατών μας.

Η αδιάλειπτη λειτουργία εξαρτάται από πολλούς παράγοντες, όπως η αρχιτεκτονική λογισμικού και η ποιότητα της καθημερινής εργασίας. Ωστόσο, αρκετά συχνά οφείλεται στο γεγονός ότι το άτομο που είναι πάντα σε επαφή απαντά στις κλήσεις από PagerDuty. Αυτή η τεχνική υποστήριξη μπορεί να είναι ένα ισχυρό εργαλείο που εστιάζει στον πελάτη, το οποίο συνδυάζει τη βοήθεια μηχανικών με αυτό που λαμβάνουν οι πελάτες όταν αγοράζουν το προϊόν σας. Ανοίγει επίσης μια μεγάλη ευκαιρία για μάθηση και ανάπτυξη, γιατί τελικά, οι αποτυχίες και τα λάθη μπορούν να είναι ένα καλό πεδίο για την εξάσκηση των δεξιοτήτων και την κατανόηση πολύπλοκων μηχανισμών εργασίας.

Το να παραμένετε «πάντα σε επαφή» εκτός των ωρών εργασίας είναι επιζήμιο για τη ζωή σας.

Αλλά την ίδια στιγμή, το να είσαι «πάντα συνδεδεμένος» μπορεί να έχει επιζήμια επίδραση στη ζωή σου. Πρέπει να είστε έτοιμοι να απαντήσετε γρήγορα και σωστά στην ειδοποίηση ότι κάτι έχει χαλάσει. Ακόμα κι αν δεν σελιδοποιείτε τη συγκεκριμένη στιγμή, η κατάσταση "πάντα ενεργό" δημιουργεί μια αίσθηση ανησυχίας και το γνωρίζω από προσωπική εμπειρία. Ειδικά εξαιτίας αυτού, η ποιότητα του ύπνου επιδεινώνεται. Το να βρίσκεστε τακτικά στη ζώνη πρόσβασης οποιαδήποτε στιγμή της ημέρας μπορεί να οδηγήσει σε εξάντληση, απάθεια ή, γενικά, στην επιθυμία να μην ξαναδείτε ποτέ τον υπολογιστή.

Ιστορικό της κατάστασης "πάντα συνδεδεμένο" στην ενδοεπικοινωνία

Στις πολύ πρώτες μέρες της ενδοεπικοινωνίας, ο CTO Ciaran ήταν μόνος του ολόκληρη η ομάδα τεχνικής υποστήριξης XNUMX/XNUMX, τόσο εντός όσο και εκτός γραφείου. Καθώς η Intercom μεγάλωνε, δημιουργήθηκε μια ομάδα εργασίας για να βοηθήσει τον Ciaran. Λίγο αργότερα, νέες ομάδες ανάπτυξης άρχισαν να δημιουργούν πολλές νέες δυνατότητες και υπηρεσίες και έχουν ήδη αναλάβει όλες τις αρμοδιότητες τεχνικής υποστήριξης.

Ανά πάσα στιγμή υπήρχαν πάρα πολλοί άνθρωποι «στη γραμμή».

Εκείνη την εποχή, αυτή η προσέγγιση φαινόταν σαν απρόβλεπτη, καθώς ήταν ένας εύκολος τρόπος να κλιμακώσουμε την ομάδα τεχνικής υποστήριξης ανά πάσα στιγμή, ήταν σύμφωνη με τις αξίες μας και μας ικανοποιούσε αίσθηση ιδιοκτησίας. Ως αποτέλεσμα, χωρίς κανένα σχέδιο, καταλήξαμε σε τέσσερις ή πέντε ομάδες που επικοινωνούσαν τακτικά με τους πελάτες κατά τη διάρκεια των μη εργάσιμων ωρών τους. Οι υπόλοιπες ομάδες ανάπτυξης δεν είχαν πολλά δύσκολα σημεία που θα μπορούσαν να κάνουν λάθος, οπότε σπάνια, αν ποτέ, κλήθηκαν.

Συνειδητοποιήσαμε ότι βρισκόμασταν σε μια κατάσταση όπου είχαμε μηχανικούς τεχνικής υποστήριξης για να είμαστε περήφανοι και μια σειρά από κρίσιμα ζητήματα που θέλαμε να αντιμετωπίσουμε, όπως:

  • Σε κάθε δεδομένη στιγμή, πάρα πολλοί άνθρωποι ήταν έτοιμοι να ανταποκριθούν στην πρόκληση. Η υποδομή μας δεν ήταν αρκετά μεγάλη για να απαιτήσει τουλάχιστον πέντε μηχανικούς ανάπτυξης που εργάζονταν χωρίς κανονικές ημέρες άδειας.
  • Η ποιότητα των διαδικασιών ειδοποιήσεων και κλήσεων δεν ήταν συνεπής μεταξύ των ομάδων, χρησιμοποιήσαμε διαδικασίες ad hoc ελέγχου για νέες και υπάρχουσες ειδοποιήσεις προβλημάτων. Οι οδηγίες στο runbook (που πρέπει να ακολουθούνται όταν εγείρεται ένα ζήτημα) ήταν κυρίως εμφανείς λόγω της απουσίας τους.
  • Ανάλογα με την ομάδα στην οποία δούλευαν οι μηχανικοί, είχαν αντικρουόμενες προσδοκίες. Για παράδειγμα, μόνο η πρώτη ομάδα τεχνικής υποστήριξης είχε αποζημίωση για βάρδιες και διακόπηκε τις διακοπές.
  • Αποδείχθηκε ότι υπάρχει ένα γενικό επίπεδο ανοχής για περιττές κλήσεις σε μονές ώρες.
  • Τέλος, αυτό το είδος εργασίας δεν είναι για όλους. Οι περιστάσεις της ζωής έδειξαν μερικές φορές ότι οι βάρδιες στο καθήκον δεν επηρεάζουν τους ανθρώπους με τον καλύτερο τρόπο.

Εύρεση της σωστής κατάστασης "πάντα συνδεδεμένος"

Αποφασίσαμε να δημιουργήσουμε μια νέα εικονική ομάδα που θα κάνει τις εργασίες τεχνικής υποστήριξης κάθε ομάδας όταν έχει ρεπό. Η ομάδα θα αποτελείται από εθελοντές, όχι στρατεύσιμους από οποιαδήποτε ομάδα του οργανισμού. Οι μηχανικοί της εικονικής ομάδας εναλλάσσονταν περίπου κάθε έξι μήνες, περνώντας εβδομάδες «σε επαφή». Ευτυχώς, δεν είχαμε κανένα πρόβλημα να βρούμε αρκετούς εθελοντές για να δημιουργήσουμε μια εικονική ομάδα.

Ως αποτέλεσμα, η ομάδα υποστήριξής μας μειώθηκε από 30 άτομα σε μόλις 6 ή 7.

Στη συνέχεια, η ομάδα συμφώνησε και όρισε πώς θα πρέπει να μοιάζουν οι ειδοποιήσεις ζητημάτων και οι περιγραφές runbook και περιέγραψε τη διαδικασία για την προώθηση ειδοποιήσεων στη νέα ομάδα υποστήριξης. Προσδιόρισαν όλες τις ειδοποιήσεις στον κώδικα χρησιμοποιώντας τη μονάδα Terraform και άρχισαν να χρησιμοποιούν την αξιολόγηση από ομοτίμους για κάθε αλλαγή. Καθιερώσαμε ένα επίπεδο αποζημίωσης για μια εβδομαδιαία βάρδια που ταίριαζε αρκετά στους αξιωματικούς υπηρεσίας. Δημιουργήσαμε επίσης μια κλιμακούμενη ομάδα δεύτερου επιπέδου, η οποία αποτελούνταν μόνο από μάνατζερ. Αυτή η εντολή θα πρέπει να είναι το μοναδικό σημείο κλιμάκωσης για τους μηχανικούς τεχνικής υποστήριξης.

Είχαμε αρκετούς μήνες σκληρής δουλειάς κατά τη διάρκεια των οποίων καθιερώσαμε αυτή τη διαδικασία, με αποτέλεσμα τώρα όχι 30 μηχανικοί να παραμένουν σε επαφή όπως πριν, αλλά μόνο 6 ή 7. Κατά τη διάρκεια των ωρών εργασίας, οι ομάδες αντιμετωπίζουν ανεξάρτητα προβλήματα με τις λειτουργίες ή τις υπηρεσίες τους. αυτή τη φορά συνήθως αντιπροσωπεύει τον μεγαλύτερο αριθμό βλαβών, αλλά τον υπόλοιπο χρόνο, η τεχνική υποστήριξη γίνεται από εθελοντές.

Τι μάθαμε

Αφού ξεκινήσαμε την εικονική ομάδα τεχνικής υποστήριξης, περιμέναμε μια πλημμύρα νέων εργασιών, όπως η διερεύνηση των αιτιών των προβλημάτων ή μια γενική συγκέντρωση για την επίλυση ενός μεμονωμένου προβλήματος που προκάλεσε συντριβή. Ωστόσο, οι ομάδες ανάπτυξής μας ανέλαβαν την πλήρη ευθύνη για τους παράγοντες που προκάλεσαν τις συντριβές και οποιαδήποτε επακόλουθη απάντηση ήταν συνήθως άμεση δράση. Χρειαζόμασταν επίσης να αποφύγουμε την κατάσταση στην οποία το έργο της τεχνικής διαβούλευσης θα επέστρεφε πίσω στην ομάδα από την οποία προήλθε, ώστε να μην αναγκαστούν οι μηχανικοί να έρθουν σε επαφή μετά από ώρες.

Οι κλήσεις εκτός ωραρίου έχουν μειωθεί σε λιγότερες από 10 μηνιαίως.

Επίσημα, η διαδικασία κλιμάκωσής μας χρησιμοποιήθηκε σπάνια. Η πιο κοινή αντίληψη ήταν ότι ο μηχανικός βοηθήθηκε ανεπίσημα από την ομάδα που ήταν αυτή τη στιγμή online, ειδικά τα παιδιά μας στο γραφείο του Σαν Φρανσίσκο. Πολλά προβλήματα έχουν επιδιορθωθεί ή μειωθεί μέσω της ομαδικής εργασίας και της άμεσης επίλυσης.

Οι μηχανικοί στο γραφείο μας στο Σαν Φρανσίσκο εντάσσονται στην ομάδα ως πλήρης ομάδα και υπερβαίνουν την τακτική τεχνική υποστήριξη. Υπήρχαν ορισμένα γενικά έξοδα, αλλά η επέκταση της ιδιότητας μέλους της ομάδας υποστήριξης σε πολλές τοποθεσίες λειτούργησε προς όφελός μας, καθώς έχει αποδειχθεί ένας καλός τρόπος για να οικοδομήσουμε σχέσεις, να τις ενισχύσουμε και να μάθετε περισσότερα για τη στοίβα τεχνολογίας με την οποία συνεργαζόμαστε όλοι.

Στις ομάδες μας, η δουλειά των προγραμματιστών Intercom έχει γίνει πιο συνεπής και μπορούμε με σιγουριά να μιλήσουμε για τα οφέλη της θέσης ενός μηχανικού συστημάτων στον ιστότοπό μας Καριέρα, δηλώνοντας ότι δεν χρειάζεται να είστε πάντα σε επαφή αν δεν το θέλετε εσείς οι ίδιοι.

Μαζί με το θεμελιώδες έργο της σταθεροποίησης και της κλιμάκωσης των αποθηκών δεδομένων μας, η συνεχής εστίαση στην επίλυση προβλημάτων είχε ως αποτέλεσμα τη μείωση των κλήσεων εκτός ωραρίου σε λιγότερες από 10 το μήνα. Είμαστε πολύ περήφανοι για αυτόν τον αριθμό.

Συνεχίζουμε να εργαζόμαστε για τη διατήρηση και τη βελτίωση της ομάδας τεχνικής υποστήριξης και καθώς η Intercom μεγαλώνει, ίσως χρειαστεί να επανεξετάσουμε τις αποφάσεις μας, γιατί αυτό που λειτουργεί σήμερα μπορεί να μην λειτουργήσει απαραίτητα την επόμενη φορά που θα διπλασιαστεί ο αριθμός του προσωπικού μας. Ωστόσο, αυτή η εμπειρία ήταν εξαιρετικά θετική για τον οργανισμό μας, βελτιώνοντας σημαντικά την ποιότητα ζωής των μηχανικών ανάπτυξης μας, την ποιότητα των απαντήσεών μας στις προκλήσεις και κυρίως την εμπειρία των πελατών μας.

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο