Nous rendons le support moins cher, en essayant de ne pas perdre en qualité

Nous rendons le support moins cher, en essayant de ne pas perdre en qualitéLe mode de repli (également appelé IPKVM), qui permet de se connecter à un VPS sans RDP directement depuis la couche hyperviseur, permet d'économiser 15 à 20 minutes par semaine.

La première et la plus importante chose à faire est de ne pas énerver les gens. Partout dans le monde, le support est divisé en lignes et le collaborateur est le premier à essayer des solutions types. Si la tâche dépasse leurs limites, transférez-la en deuxième ligne. Ainsi, parmi les administrateurs VDS, il y a souvent des gens qui savent penser. Contrairement à de nombreux autres supports. Eh bien, au moins beaucoup plus souvent. Et ils structurent bien le ticket, décrivant immédiatement tout ce qui est nécessaire. Si la première ligne « devient floue » et qu’ils vous demandent accidentellement de l’activer et de la désactiver en réponse, c’est un fiasco.

La tâche est très simple : fournir un support adéquat à notre hébergement VDS à un coût minimum. Parce que nous sommes le fast food du monde des hébergeurs : pas de « léchage » particulier, des prix bas, une qualité normale. Plus tôt Il y avait déjà une histoire sur le fait qu'avec l'avènement des amoureux d'Instagram essayant d'automatiser la gestion des comptes et des propriétaires de petites entreprises avec une comptabilité à distance et d'autres personnes qui ne sont pas très avancées en technologie, la communication « d'administrateur à administrateur » a cessé de fonctionner. J'ai dû changer de langue de communication.

Je vais maintenant vous en dire un peu plus sur les processus - et sur les problèmes inévitables qu'ils posent.

N'énervez pas les gens #1

Tout support est une production à la chaîne. Une candidature arrive, l'employé de première ligne essaie immédiatement de reconnaître une situation typique qui s'est déjà produite mille fois et qui se reproduira mille fois. Il y a 90 % de chances que l'application soit typique, et vous pouvez y répondre en appuyant littéralement sur quelques boutons pour remplacer le modèle. Il vous suffit généralement d’écrire quelques mots dans le modèle et le tour est joué. Ou accédez à l'interface de gestion et appuyez sur quelques boutons. Dans les cas plus complexes (transferts de zone à zone par exemple), il faut suivre l'algorithme.

Ce qui irrite le plus, quelles que soient les autres qualités de l’accompagnement, c’est la réaction typique face à une demande atypique. Un ticket arrive, où tout est décrit en détail, il y a beaucoup de données nécessaires pour trois questions à venir, le client anticipe un dialogue... Et dès les premiers mots, l'employé de support en pilote automatique tape un accord pour remplacer le modèle "Essayez de redémarrer, ça devrait aider."

C’est ce qui ouvre réellement l’esprit des gens, et c’est après de telles situations que subsistent les critiques les plus négatives et les commentaires colériques. C’est clair qu’on avait tellement tort, c’est là qu’on connaît les statistiques. En général, nous avons commis des erreurs de différentes manières, mais de tels cas sont toujours tout simplement fous. Y compris pour nous-mêmes. Bien sûr, nous aimerions que cela n’arrive pas du tout. Mais en pratique, ce n'est pas très possible : toutes les quelques semaines, un employé fatigué de la monotonie appuie sur des boutons amusants.

N'énervez pas les gens #2

La deuxième chose qui ouvre également l’esprit, c’est lorsque personne ne répond à un ticket assez longtemps. En Europe, ce comportement d'accompagnement est normal : trois jours avant l'acceptation d'un incident pour le travail, c'est plus que la norme. Même si vous êtes très urgent et que quelque chose brûle - pas de réseaux sociaux, pas de téléphone, pas de messagerie, envoyez simplement un e-mail et attendez votre tour. En Russie, c'est beaucoup moins courant, mais certains billets sont encore « oubliés ». Au tout début des travaux, nous avons fixé un SLA pour la première réponse de 15 minutes. Et c'est honnête 24h/7 et XNUMXj/XNUMX. Il est clair que lorsque l’hébergement VDS devient important, cela apparaît. Mais les fournisseurs de services douteux ne disposent pas de cela. Et nous étions juste dubitatifs au début et ce n'est qu'après que nous sommes devenus plus ou moins grands. Bon, plus ou moins moyen.

La première ligne est composée d'opérateurs qui ont reçu des scripts et ont appris à réagir à des situations typiques. Ils résolvent rapidement les problèmes et essaient en 15 minutes soit de répondre par une action typique, soit de signaler que le ticket est en cours et de le transférer au second.

La deuxième ligne est celle des administrateurs d'hébergement, ils savent presque tout faire à la main. Il existe également un responsable du support qui peut tout faire et un peu plus. La troisième ligne, ce sont les développeurs, ils reçoivent des tickets du type « corrigez ça dans l'interface » ou « tel ou tel paramètre est mal pris en compte ».

Réduire le nombre de candidatures

Pour des raisons évidentes, si vous souhaitez fournir une assistance à moindre coût, vous ne devez pas augmenter la première ligne afin que les utilisateurs puissent gérer les scripts plus rapidement, mais augmenter l'automatisation. Pour qu'à la place des gens avec des scripts, il y ait de vrais scripts. Par conséquent, l'une des premières choses que nous avons faites a été d'automatiser les processus de création d'une machine virtuelle, de mise à l'échelle par ressources (y compris par montée et descente de disque, mais pas par fréquence de processeur) et d'autres choses similaires. Plus l'utilisateur peut faire de choses depuis l'interface, plus il est facile de vivre avec la première ligne et plus elle peut être petite. Lorsqu'un utilisateur accède à quelque chose qui se trouve dans son compte personnel, il doit le faire et lui indiquer comment il peut le faire lui-même.

Si vous n'avez pas besoin de soutien, alors elle fait du bon travail.

La deuxième fonctionnalité, qui permet de gagner beaucoup de temps, est le temps nécessaire pour remplir la base de connaissances. Si l'utilisateur rencontre un problème qui n'est pas inclus dans la liste des actions prises en charge (il s'agit le plus souvent de questions au niveau de « comment installer un serveur Minecraft » ou « Où configurer un VPS dans Win Server »), alors un l'article est écrit dans la base de connaissances. Le même article détaillé est rédigé pour toutes les demandes étranges. Par exemple, si un utilisateur demande à l'assistance de supprimer le pare-feu intégré de Windows Server, nous lui envoyons des informations sur ce qui se passera s'il est réellement désactivé et sur la manière de modifier les autorisations uniquement pour les logiciels sélectionnés. Parce que le problème vient généralement du fait que quelque chose ne peut pas se connecter à cause des paramètres, et non du pare-feu lui-même. Mais il est très difficile d'expliquer cela à chaque fois dans le dialogue. Mais d'une manière ou d'une autre, je ne veux pas désactiver le pare-feu, car nous perdrons bientôt soit la machine virtuelle, soit le client.

Si quelque chose concernant un logiciel d'application dans la base de connaissances devient très populaire, vous pouvez alors ajouter la distribution au marché afin que le service « configurer un serveur avec celui-ci déjà installé » apparaisse. En fait, c'est ce qui s'est passé avec Docker, et c'est ce qui s'est passé avec le serveur Minecraft. Encore une fois, un bouton « faites-moi du bien » dans l'interface permet d'économiser jusqu'à des centaines de tickets par an.

Mode d'urgence

Après ces étapes, les pannes les plus graves nécessitant un travail manuel restent le fait que l'utilisateur, pour une raison quelconque, a perdu les moyens d'accès à distance au système d'exploitation invité dans l'hyperviseur. Le cas le plus courant est simplement un paramètre de pare-feu incorrect, le deuxième cas le plus courant concerne certains bugs qui empêchent Win de démarrer normalement et vous obligent à redémarrer en mode sans échec. Et en mode sans échec, RDP n'est pas disponible par défaut.

Nous avons créé un mode d'urgence pour ce cas. En fait, généralement, pour accéder à une machine VDS, vous devez disposer d’une sorte de client pour le travail à distance. Le plus souvent, nous parlons d'accès à la console, RDP, VNC ou quelque chose de similaire. L’inconvénient de ces méthodes est qu’elles ne fonctionnent pas sans OS. Mais au niveau de l'hyperviseur on peut recevoir l'image sur l'écran et y transmettre les appuis sur le clavier ! Certes, cela charge beaucoup le processeur (en raison de la diffusion vidéo elle-même), mais cela permet d'obtenir le résultat souhaité.

Par conséquent, nous avons donné accès au mode d'urgence à tous les utilisateurs, mais il est limité en termes de durée d'utilisation continue. Heureusement, comme le montre la pratique, ce temps est largement suffisant pour redémarrer et réparer quelque chose.

Le résultat est encore moins de tickets d’assistance. Et là où l’administrateur peut résoudre le ticket lui-même, l’assistance n’a pas besoin d’intervenir et de le découvrir.

Problèmes restants

Très souvent, les utilisateurs pensent que le support leur impose quelque chose. Malheureusement, rien ne peut être fait à ce sujet (ou nous n’avons rien trouvé). Les deux exemples les plus courants sont les limites de ressources et la protection DDoS.

Chaque machine virtuelle a des limites sur la charge du disque, la mémoire et le trafic autorisé. La possibilité de fixer des limites est précisée dans l'offre, mais les limites elles-mêmes sont sélectionnées de manière à ce que la plupart des utilisateurs puissent travailler tranquillement sans même les connaître. Mais si vous commencez soudainement à trop manipuler le canal et le disque, les algorithmes avertissent automatiquement l'utilisateur. Depuis avril de l'année dernière, nous avons supprimé les verrouillages automatiques. Au lieu de cela, fixer des limites souples pour une période variable.

Auparavant, cela se passait ainsi : un avertissement, puis, si l'utilisateur n'y tenait pas compte, un blocage automatique. Et à ce moment-là, les gens s’offusquaient : « De quoi tu parles, c’est ton système qui est buggé, il ne s’est rien passé ! - et ensuite vous pourrez soit essayer de comprendre le logiciel d'application, soit proposer d'augmenter le plan tarifaire. Nous n'avons pas la possibilité de comprendre le fonctionnement des logiciels d'application, car cela dépasse le cadre du support. Même si les premiers cas ont été réglés en collaboration avec les utilisateurs. Je me souviens particulièrement de celui où le tricheur de vues YouTube avait un cheval de Troie intégré, et ce cheval de Troie perdait de la mémoire. Au final, nous sommes arrivés à la conclusion qu'il ne s'agissait pas de Heisenbugs, mais de problèmes avec les utilisateurs, sinon nous aurions été inondés de demandes similaires. Mais personne n’a encore admis qu’il pouvait lui-même dépasser les tarifs.

Une histoire similaire se produit avec les DDoS : nous écrivons que vous, cher utilisateur, êtes attaqué. Connectez la protection, s'il vous plaît. Et l'utilisateur : "Oui, vous m'attaquez vous-même !" Bien sûr, nous effectuons des attaques DDoS sur un seul utilisateur afin de lui faire perdre 300 roubles. C'est une activité rentable. Oui, je sais que de nombreux grands sites d'hébergement de la catégorie la plus chère incluent cette protection dans le tarif, mais nous ne pouvons pas faire cela : l'économie de la restauration rapide dicte d'autres prix minimum.

Tout aussi souvent, ceux dont nous avons supprimé les données ne sont pas satisfaits de l’assistance. Dans le sens où il a été légitimement supprimé après la fin de la période payée. Si quelqu'un ne renouvelle pas sa location VDS, plusieurs notifications sont envoyées expliquant la suite des événements. Une fois le paiement effectué, la machine virtuelle s'arrête, mais son image est enregistrée. Une autre notification arrive, puis quelques autres. L'image est stockée pendant sept jours supplémentaires avant d'être supprimée définitivement. Il y a donc une catégorie de personnes qui sont très mécontentes de cela. Partant de « l'administrateur a démissionné, des notifications ont été envoyées à son email, réintégration » et se terminant par des accusations de fraude et de menaces de blessures physiques. La raison est que les prix sont les mêmes pour tous les autres utilisateurs. Si nous le stockons pendant un mois, nous aurons besoin de plus de stockage. Cela signifiera des prix plus élevés pour chaque client individuel. Et l’économie de la restauration rapide… Eh bien, vous voyez l’idée. Et en conséquence, sur les forums, nous recevons des critiques dans l'esprit de « ils ont pris de l'argent, supprimé des données, des escrocs ».

Je voudrais noter que nous avons une ligne de tarifs premium. Là, bien sûr, la situation est différente, puisque nous prenons en compte les souhaits du client et fixons de manière flexible à la fois la limite et la suppression en cas de non-paiement (nous la mettons au moins, juste pour ne pas la bloquer). Là-bas, cela est déjà économiquement réalisable, car tout peut arriver et fidéliser un gros client permanent coûte cher.

Parfois, les utilisateurs sont malveillants. Plusieurs fois, notre système a connu des pannes avec des centaines de machines virtuelles bloquées en raison d'actions clairement illégitimes de clients. En fait, c'est précisément à cause de telles situations que nous avions besoin de nos propres pilotes réseau pour surveiller l'activité du réseau et voir que l'utilisateur n'exécutait pas d'attaque depuis son serveur. La surveillance d'un tel plan est importante afin que les limites des machines virtuelles voisines ne soient pas violées par des voyous.

Il y a ceux qui simplement spamment, exploitent ou violent l'offre. Puis il frappe pour demander de l'aide et demande ce qui n'a pas fonctionné et pourquoi la voiture est bloquée. Si le processus décrit dans le ticket dans la capture d'écran s'appelle « spam sender.exe », alors quelque chose ne va probablement pas. Environ une fois toutes les deux semaines, nous recevons des plaintes de Sony ou de Lucasfilm (maintenant Disney) selon lesquelles quelqu'un de notre machine virtuelle appartenant à notre gamme d'adresses IP distribue un film gravé. Pour cela, vous bloquerez et restituerez immédiatement l'argent restant sur le compte selon l'offre (je vous rappelle : notre quantification est par seconde, c'est-à-dire qu'il y aura toujours un solde, c'est sûr). Et pour récupérer l'argent, selon la loi, vous devez présenter votre passeport : c'est la lutte contre le blanchiment d'argent. Pour une raison quelconque, au lieu de montrer un passeport, les pirates écrivent que nous leur avons retiré de l'argent, en oubliant de clarifier certaines circonstances.

Oh oui. Notre meilleure demande de l'année est : « Puis-je tester une machine virtuelle pendant quelques jours au tarif de 30 roubles par mois avant de l'acheter ?

Total

La première ligne trie les tickets et répond par des actions typiques. C’est là que réside le plus d’insatisfaction. Il ne sera toujours pas possible de résoudre ce problème, car la base pour y remédier réside dans l'automatisation de l'hébergement, c'est-à-dire dans un énorme retard. Oui, nous en avons plus que beaucoup sur le marché, mais toujours pas assez. La meilleure chose à faire est donc d’établir une surveillance de première ligne. Surveillance du Help Desk - Mise en œuvre des KPI de première ligne. Les retards dans les SLA sont visibles en temps réel : qui fait des erreurs, souvent - pourquoi. Grâce à de telles alertes, les applications ne sont jamais perdues. Oui, il est possible de répondre au ticket avec un modèle qui n'est pas sur le sujet, mais nous le découvrons déjà grâce aux commentaires.

Si le client le demande vraiment, alors le spécialiste de deuxième ligne peut se rendre sur le serveur et y faire ce dont le client a besoin (la condition est une confirmation par lettre dans laquelle il fournira les informations de connexion au serveur).

Nous le faisons très rarement et nous confions ce travail uniquement aux meilleurs, car nous voulons avoir la garantie que les données des utilisateurs ne seront pas endommagées. Les meilleurs sont la deuxième ligne de support.

La première ligne contient une base de connaissances que vous pouvez envoyer pour rechercher des éléments complexes.

Un compte personnel riche en fonctionnalités et une base de connaissances - et nous avons désormais pu réduire le nombre de demandes à 1 à 1,5 par an et par client en moyenne.

La deuxième ligne traite généralement des applications complexes nécessitant un travail manuel. Ce qui est typique : plus le plan tarifaire est cher, moins il y a de telles demandes par machine virtuelle. Habituellement, parce que ceux qui peuvent se permettre un tarif élevé ont des spécialistes parmi leur personnel, ou tout simplement la moitié des problèmes ne se posent pas du fait qu'il y a suffisamment de configuration pour tout. Je me souviens encore du héros qui a installé le Windows Server, pas le plus ancien, sur une configuration dotée de 256 Mo de RAM.

La deuxième ligne contient un ensemble de kits de distribution et un ensemble de scripts d'automatisation. Les deux peuvent être mis à jour selon les besoins.

La deuxième ligne et les gestionnaires personnels des tarifs VIP peuvent ajouter des notes au profil du client. S’il est un administrateur Linux, nous l’écrirons. Ce sera l'indice de première ligne : l'utilisateur sait avec certitude qu'il ne s'agira pas d'une balle dans la jambe, mais d'une destruction contrôlée.

La troisième ligne est la plus étrange. Par exemple, nous avons eu un bug qui rendait impossible l'accès à une des fonctions de votre compte personnel dans Firefox. L’utilisateur a directement fait chanter : « Si vous ne réparez pas le problème dans les 12 heures, j’écrirai sur tous les avis d’hôtes. » Il s’est avéré que le problème venait du bloc publicitaire personnalisé. Du côté des utilisateurs, curieusement. Souvent, des erreurs complexes se produisent sans détails et ne peuvent plus se répéter. Il y a des détectives avec une capture d'écran : « Pourquoi le réparez-vous pendant un mois ? - "Oui, nous avons cherché votre bug tout ce temps", "Oh, eh bien, je l'ai encore retrouvé aujourd'hui, mais je n'ai pas pu le répéter"...

En général, on ne sait jamais où aboutira une capture d'écran d'un dialogue avec l'assistance, et si une personne frappe pour obtenir de l'aide, alors elle a un problème. Vous pouvez améliorer votre attitude. Au moins, essaie.

Oui, nous savons que notre support n'est pas parfait, mais j'aimerais croire qu'il allie suffisamment de rapidité et suffisamment de qualité. Et cela n’augmente pas les tarifs pour ceux qui peuvent s’en passer.

Nous rendons le support moins cher, en essayant de ne pas perdre en qualité

Source: habr.com

Ajouter un commentaire