Wir machen den Support günstiger und versuchen, die Qualität nicht zu verlieren

Wir machen den Support günstiger und versuchen, die Qualität nicht zu verlierenDer Fallback-Modus (auch als IPKVM bezeichnet), der es Ihnen ermöglicht, direkt von der Hypervisor-Ebene aus eine Verbindung zu einem VPS ohne RDP herzustellen, spart 15–20 Minuten pro Woche.

Das Erste und Wichtigste ist, die Leute nicht zu verärgern. Überall auf der Welt ist der Support in Linien unterteilt und der Mitarbeiter ist der Erste, der typische Lösungen ausprobiert. Wenn die Aufgabe ihre Grenzen überschreitet, übertragen Sie sie in die zweite Zeile. Unter VDS-Administratoren gibt es also häufig Leute, die wissen, wie man denkt. Im Gegensatz zu vielen anderen Stützen. Na ja, zumindest deutlich häufiger. Und sie strukturieren das Ticket gut und beschreiben sofort alles, was benötigt wird. Wenn die erste Zeile „unscharf wird“ und Sie als Reaktion darauf versehentlich zum Ein- und Ausschalten auffordert, ist das ein Fiasko.

Die Aufgabe ist ganz einfach: angemessenen Support für unser VDS-Hosting zu minimalen Kosten bereitzustellen. Denn wir sind das Fast Food der Hosting-Anbieter-Welt: kein besonderes „Schlecken“, niedrige Preise, normale Qualität. Früher Es gab bereits eine Geschichte darüber, dass mit dem Aufkommen von Instagram-Lieblingen, die versuchten, die Kontoverwaltung zu automatisieren, und Kleinunternehmern mit Remote-Buchhaltung und anderen Leuten, die technisch nicht sehr fortgeschritten waren, die Kommunikation „von einem Administrator zu einem Administrator“ nicht mehr funktionierte. Ich musste die Kommunikationssprache ändern.

Jetzt erzähle ich Ihnen etwas mehr über die Prozesse – und über die unvermeidlichen Probleme, die damit verbunden sind.

Verärgere die Leute nicht, Nr. 1

Jede Unterstützung ist eine Fließbandproduktion. Eine Bewerbung geht ein, der Mitarbeiter in der ersten Reihe versucht sofort, eine typische Situation zu erkennen, die schon tausendmal passiert ist und noch tausendmal passieren wird. Es besteht eine Wahrscheinlichkeit von 90 %, dass es sich bei der Anwendung um eine typische handelt, und Sie können die Frage beantworten, indem Sie buchstäblich ein paar Tasten drücken, sodass die Vorlage ersetzt wird. Normalerweise müssen Sie nur ein paar Wörter in die Vorlage schreiben und schon sind Sie fertig. Oder gehen Sie zur Verwaltungsoberfläche und drücken Sie dort ein paar Tasten. In komplexeren Fällen (z. B. Übertragungen von Zone zu Zone) müssen Sie dem Algorithmus folgen.

Was die Menschen, unabhängig von anderen Qualitäten der Unterstützung, am meisten irritiert, ist die typische Reaktion auf eine atypische Anfrage. Es kommt ein Ticket, in dem alles detailliert beschrieben wird, viele notwendige Daten für drei vor uns liegende Fragen vorliegen, der Kunde erwartet einen Dialog ... Und den ersten Worten zufolge tippt der Supportmitarbeiter im Autopiloten einen Akkord ein, um die Vorlage zu ersetzen „Versuchen Sie einen Neustart, es sollte helfen.“

Das ist es, was den Geist der Menschen wirklich öffnet, und nach solchen Situationen bleiben die meisten negativen Bewertungen und wütenden Kommentare zurück. Es ist klar, dass wir uns so geirrt haben, daher kennen wir die Statistiken. Im Allgemeinen haben wir auf unterschiedliche Weise Fehler gemacht, aber solche Fälle sind immer nur wild. Auch für uns selbst. Natürlich möchten wir, dass dies überhaupt nicht passiert. In der Praxis ist dies jedoch kaum möglich: Alle paar Wochen drückt ein von der Monotonie müder Mitarbeiter die lustigen Knöpfe.

Verärgere die Leute nicht, Nr. 2

Das zweite, was den Geist gleichermaßen öffnet, ist, wenn lange genug niemand auf ein Ticket reagiert. In Europa ist dieses Supportverhalten normal: Drei Tage, bevor ein Vorfall zur Arbeit angenommen wird, sind mehr als die Norm. Auch wenn Sie sehr dringend sind und etwas brennt – keine sozialen Netzwerke, kein Telefon, kein Messenger, einfach eine E-Mail senden und warten, bis Sie an der Reihe sind. In Russland ist dies deutlich seltener, aber manche Tickets werden trotzdem „vergessen“. Gleich zu Beginn der Arbeit haben wir ein SLA für die erste Antwort von 15 Minuten festgelegt. Und das ist rund um die Uhr ehrlich. Es ist klar, dass dies auftritt, wenn das VDS-Hosting groß wird. Doch unseriöse Dienstleister verfügen nicht über diese. Und wir waren am Anfang einfach skeptisch und erst dann mehr oder weniger groß geworden. Okay, mehr oder weniger durchschnittlich.

Die erste Zeile besteht aus Bedienern, denen Skripte gegeben und beigebracht wurden, auf typische Situationen zu reagieren. Sie lösen Probleme schnell und versuchen innerhalb von 15 Minuten entweder mit einer typischen Aktion zu reagieren oder zu melden, dass das Ticket in Bearbeitung ist, und es an den zweiten weiterzuleiten.

Die zweite Reihe sind Hosting-Administratoren; sie wissen, wie man fast alles von Hand erledigt. Es gibt auch einen Support-Manager, der alles und noch ein bisschen mehr kann. Die dritte Zeile sind die Entwickler, sie erhalten Tickets wie „Reparieren Sie dies in der Schnittstelle“ oder „Dieser und jener Parameter wird falsch berücksichtigt.“

Reduzieren Sie die Anzahl der Bewerbungen

Wenn Sie kostengünstigen Support leisten möchten, sollten Sie aus offensichtlichen Gründen nicht die erste Zeile vergrößern, damit die Leute Skripte schneller bearbeiten können, sondern die Automatisierung erhöhen. Damit es statt Menschen mit Drehbüchern echte Drehbücher gibt. Daher bestand eines der ersten Dinge, die wir taten, darin, die Prozesse des Hochfahrens einer virtuellen Maschine, der Skalierung nach Ressourcen (einschließlich nach oben und unten, aber nicht nach Prozessorfrequenz) und anderen ähnlichen Dingen zu automatisieren. Je mehr der Benutzer über die Benutzeroberfläche tun kann, desto einfacher ist es, mit der ersten Zeile zu leben, und desto kleiner kann sie sein. Wenn ein Benutzer auf etwas zugreift, das sich in seinem persönlichen Konto befindet, muss er dies tun und ihm mitteilen, wie er es selbst tun kann.

Wenn Sie keine Unterstützung benötigen, leistet sie gute Arbeit.

Das zweite Merkmal, das viel Zeit spart, ist die lange Zeit, die zum Ausfüllen der Wissensdatenbank benötigt wird. Wenn der Benutzer ein Problem hat, das nicht in der Liste der unterstützten Aktionen enthalten ist (meistens handelt es sich dabei um Fragen auf der Ebene „Wie installiert man einen Minecraft-Server“ oder „Wo richtet man einen VPS in Win Server ein“), dann ein Artikel ist in der Wissensdatenbank geschrieben. Derselbe ausführliche Artikel wird für alle seltsamen Anfragen geschrieben. Wenn ein Benutzer beispielsweise den Support darum bittet, die integrierte Windows Server-Firewall zu entfernen, schicken wir ihn mit der Bitte, zu lesen, was passiert, wenn sie tatsächlich deaktiviert wird, und wie man Berechtigungen nur für ausgewählte Software ändert. Denn das Problem liegt meist darin, dass sich etwas aufgrund der Einstellungen nicht verbinden kann, und nicht an der Firewall selbst. Aber es ist sehr schwierig, dies jedes Mal im Dialog zu erklären. Aber irgendwie möchte ich die Firewall nicht deaktivieren, denn schon bald werden wir entweder die virtuelle Maschine oder den Client verlieren.

Wenn etwas zum Thema Anwendungssoftware in der Wissensdatenbank sehr beliebt wird, können Sie die Distribution zum Marktplatz hinzufügen, sodass der Dienst „Einen Server einrichten, auf dem diese bereits installiert ist“ angezeigt wird. Genau das ist mit Docker passiert, und das ist auch mit dem Minecraft-Server passiert. Auch hier spart ein einziger „Tu mir Gutes“-Button in der Benutzeroberfläche bis zu Hunderte von Tickets pro Jahr.

Notfallmodus

Nach diesen Schritten bleiben die schwerwiegendsten Ausfälle, die manuelle Arbeit erfordern, mit der Tatsache zurück, dass der Benutzer aus irgendeinem Grund die Möglichkeit zum Fernzugriff auf das Gastbetriebssystem im Hypervisor verloren hat. Der häufigste Fall ist einfach eine falsche Firewall-Einstellung, der zweithäufigste sind einige Fehler, die den normalen Start von Win verhindern und Sie zu einem Neustart im abgesicherten Modus zwingen. Und im abgesicherten Modus ist RDP standardmäßig nicht verfügbar.

Für diesen Fall haben wir einen Notfallmodus erstellt. Tatsächlich benötigen Sie für den Zugriff auf einen VDS-Rechner normalerweise eine Art Client für Remote-Arbeit. Am häufigsten sprechen wir über Konsolenzugriff, RDP, VNC oder ähnliches. Der Nachteil dieser Methoden besteht darin, dass sie ohne Betriebssystem nicht funktionieren. Aber auf der Hypervisor-Ebene können wir das Bild auf dem Bildschirm empfangen und Tastatureingaben dorthin übertragen! Dies belastet zwar den Prozessor ziemlich stark (aufgrund der eigentlichen Videoübertragung), aber es ermöglicht Ihnen, das gewünschte Ergebnis zu erzielen.

Daher haben wir allen Benutzern den Zugriff auf den Notfallmodus ermöglicht, der jedoch hinsichtlich der Dauer der Dauernutzung begrenzt ist. Glücklicherweise reicht diese Zeit, wie die Praxis zeigt, völlig aus, um neu zu starten und etwas zu reparieren.

Das Ergebnis sind noch weniger Support-Tickets. Und wo der Administrator das Ticket selbst beheben kann, muss der Support nicht hinzugehen und sich darum kümmern.

Verbleibende Probleme

Sehr oft denken Benutzer, dass ihnen der Support etwas aufdrängt. Daran lässt sich leider nichts ändern (bzw. uns ist nichts eingefallen). Die beiden häufigsten Beispiele sind Ressourcenlimits und DDoS-Schutz.

Für jede virtuelle Maschine gelten Beschränkungen hinsichtlich der Festplattenlast, des Arbeitsspeichers und des zulässigen Datenverkehrs. Die Möglichkeit, Grenzwerte festzulegen, ist im Angebot angegeben, die Grenzwerte selbst sind jedoch so gewählt, dass die meisten Benutzer unbemerkt arbeiten können, ohne davon zu wissen. Wenn man aber plötzlich anfängt, zu sehr an Kanal und Festplatte herumzufummeln, warnen die Algorithmen den Benutzer automatisch. Seit April letzten Jahres haben wir automatische Schlösser entfernt. Stattdessen werden weiche Grenzwerte für einen variablen Zeitraum festgelegt.

Bisher war das so: eine Warnung, dann, wenn der Nutzer nicht beachtet, eine automatische Sperrung. Und in diesem Moment waren die Leute beleidigt: „Wovon redest du, dein System ist fehlerhaft, nichts ist passiert!“ - und dann können Sie entweder versuchen, die Anwendungssoftware zu verstehen, oder eine Tariferhöhung anbieten. Wir haben keine Möglichkeit, die Funktionsweise von Anwendungssoftware zu verstehen, da dies über den Rahmen des Supports hinausgeht. Allerdings wurden die ersten Fälle gemeinsam mit den Nutzern geklärt. Ich erinnere mich besonders an den Fall, bei dem der YouTube-Views-Betrüger einen eingebauten Trojaner hatte und dieser Trojaner Speicherlecks verursachte. Am Ende kamen wir zu dem Schluss, dass es sich nicht um Heisenbugs, sondern um Probleme mit Nutzern handelte, sonst wären wir mit ähnlichen Anfragen überschwemmt worden. Doch dass er selbst die Zölle überschreiten könnte, hat bisher noch kein einziger Mensch zugegeben.

Ähnlich verhält es sich mit DDoS: Wir schreiben, dass Sie, lieber Benutzer, angegriffen werden. Schließen Sie bitte den Schutz an. Und der User: „Ja, du greifst mich selbst an!“ Natürlich haben wir nur einen Benutzer per DDoS attackiert, um ihn um 300 Rubel zu betrügen. Es ist ein profitables Geschäft. Ja, ich weiß, dass viele große Hosting-Sites in der teureren Kategorie diesen Schutz im Tarif enthalten, aber das können wir nicht tun: Die Fast-Food-Wirtschaft schreibt andere Mindestpreise vor.

Ebenso häufig sind diejenigen, deren Daten wir gelöscht haben, mit dem Support unzufrieden. In dem Sinne, dass es nach Ablauf des bezahlten Zeitraums rechtmäßig gelöscht wurde. Wenn jemand seine VDS-Miete nicht verlängert, werden mehrere Benachrichtigungen gesendet, in denen erläutert wird, was als nächstes geschieht. Wenn die Zahlung abgeschlossen ist, stoppt die virtuelle Maschine, ihr Image wird jedoch gespeichert. Es kommt eine weitere Benachrichtigung und dann noch ein paar weitere. Das Bild wird weitere sieben Tage gespeichert, bevor es endgültig gelöscht wird. Es gibt also eine Kategorie von Menschen, die damit sehr unzufrieden sind. Angefangen bei „Der Administrator kündigte, Benachrichtigungen wurden an seine E-Mail-Adresse gesendet, Wiedereinsetzung“ und endete mit Betrugsvorwürfen und der Androhung körperlicher Gewalt. Der Grund sind die gleichen Preise für alle anderen Nutzer. Wenn wir es einen Monat lang aufbewahren, benötigen wir mehr Speicherplatz. Dies führt zu höheren Preisen für jeden einzelnen Kunden. Und die Ökonomie von Fast Food ... Nun, Sie verstehen, was es bedeutet. Und als Ergebnis erhalten wir in den Foren Bewertungen im Sinne von „Sie haben Geld genommen, Daten gelöscht, Betrüger.“

Ich möchte darauf hinweisen, dass wir eine Reihe von Premium-Tarifen haben. Dort ist die Situation natürlich anders, da wir die Wünsche des Kunden berücksichtigen und sowohl das Limit als auch die Löschung bei Nichtzahlung flexibel festlegen (wir setzen es ins Minus, nur um es nicht zu blockieren). Dort ist es schon wirtschaftlich machbar, denn es kann wirklich alles passieren und die dauerhafte Bindung eines Großkunden ist teuer.

Manchmal sind Benutzer böswillig. Mehrere Male kam es in unserem System zu Ausfällen, bei denen Hunderte von virtuellen Maschinen aufgrund eindeutig unzulässiger Aktionen von Clients blockiert wurden. Genau wegen solcher Situationen brauchten wir unsere eigenen Netzwerktreiber, um die Netzwerkaktivität zu überwachen und sicherzustellen, dass der Benutzer keinen Angriff von seinem Server aus ausführte. Die Überwachung eines solchen Plans ist wichtig, damit die Grenzen benachbarter virtueller Maschinen nicht von lautstarken Kerlen verletzt werden.

Es gibt diejenigen, die das Angebot einfach spammen, „minen“ oder auf andere Weise gegen das Angebot verstoßen. Dann klopft er um Unterstützung und fragt, was schief gelaufen sei und warum das Auto blockiert sei. Wenn der Prozess im Ticket im Screenshot „spam sender.exe“ heißt, dann läuft wahrscheinlich etwas schief. Ungefähr alle zwei Wochen erhalten wir Beschwerden von Sony oder Lucasfilm (jetzt Disney), dass jemand aus unserer virtuellen Maschine aus unserem IP-Adressbereich einen gebrannten Film vertreibt. Dafür werden Sie das verbleibende Geld auf dem Konto sofort sperren und gemäß dem Angebot zurückerstatten (ich möchte Sie daran erinnern: Unsere Quantisierung erfolgt pro Sekunde, d. h. es wird mit Sicherheit immer ein Saldo vorhanden sein). Und um das Geld zurückzubekommen, müssen Sie laut Gesetz Ihren Reisepass vorzeigen: Das ist Geldwäschebekämpfung. Aus irgendeinem Grund schreiben die Piraten, anstatt einen Pass vorzuzeigen, dass wir ihnen Geld entzogen haben und vergessen haben, einige Umstände zu klären.

Oh ja. Unsere beste Anfrage des Jahres lautet: „Kann ich eine virtuelle Maschine vor dem Kauf ein paar Tage lang für 30 Rubel pro Monat testen?“

Ergebnis

Die erste Zeile sortiert Tickets und reagiert mit typischen Aktionen. Hier herrscht die größte Unzufriedenheit. Es wird immer noch nicht möglich sein, dies zu beheben, da die Grundlage für die Behebung in der Hosting-Automatisierung liegt, also in einem riesigen Rückstand. Ja, wir haben mehr als viele andere auf dem Markt, aber immer noch nicht genug. Daher ist es das Beste, eine Erstüberwachung einzurichten. Helpdesk-Überwachung – KPI-Implementierung in erster Linie. SLA-Verzögerungen werden in Echtzeit sichtbar: Wer macht oft Fehler – warum. Dank solcher Warnungen gehen Anwendungen nie verloren. Ja, das Ticket kann mit einer Vorlage beantwortet werden, die nicht zum Thema passt, aber das erfahren wir bereits aus dem Feedback.

Wenn der Kunde wirklich danach fragt, kann der Second-Line-Spezialist zum Server gehen und dort tun, was der Kunde braucht (Voraussetzung ist eine Bestätigung per Brief, in der er dem Server die Zugangsdaten mitteilt).

Wir tun dies sehr selten und vertrauen solche Arbeiten nur den Besten an, da wir Garantien haben möchten, dass Benutzerdaten nicht beschädigt werden. Die besten sind die zweite Unterstützungslinie.

In der ersten Zeile befindet sich eine Wissensdatenbank, in die Sie komplexe Dinge nachschlagen können.

Ein persönliches Konto mit vielen Funktionen und einer Wissensdatenbank – und jetzt konnten wir die Anzahl der Anfragen auf durchschnittlich 1–1,5 pro Jahr und Kunde reduzieren.

In der zweiten Linie werden in der Regel komplexe Anwendungen bearbeitet, die manuelle Arbeit erfordern. Typisch ist: Je teurer der Tarifplan, desto weniger solcher Anfragen pro virtueller Maschine. Meistens, weil diejenigen, die sich einen teuren Tarif leisten können, entweder Spezialisten im Personal haben oder einfach die Hälfte der Probleme nicht dadurch entstehen, dass für alles genügend Konfiguration vorhanden ist. Ich erinnere mich noch an den Helden, der den nicht ältesten Windows Server auf einer Konfiguration mit 256 MB RAM installierte.

Die zweite Zeile enthält eine Reihe von Distributionskits und eine Reihe von Automatisierungsskripten. Beide können bei Bedarf aktualisiert werden.

Die Second-Line- und persönlichen Manager von VIP-Tarifen können dem Kundenprofil Notizen hinzufügen. Wenn er ein Linux-Administrator ist, schreiben wir das auf. Dies wird der erste Zeilenhinweis sein: Der Benutzer weiß mit Sicherheit, dass es sich nicht um einen Schuss ins Bein, sondern um eine kontrollierte Zerstörung handelt.

Die dritte Zeile regiert am seltsamsten. Wir hatten beispielsweise einen Fehler, der es unmöglich machte, auf eine der Funktionen Ihres persönlichen Kontos in Firefox zuzugreifen. Der Benutzer erpresste direkt: „Wenn Sie das Problem nicht innerhalb von 12 Stunden beheben, werde ich auf allen Host-Bewertungen schreiben.“ Wie sich herausstellte, lag das Problem im benutzerdefinierten Adblock. Seltsamerweise auf der Benutzerseite. Oftmals entstehen komplexe Fehler ohne Details und können nicht mehr wiederholt werden. Es gibt Detektive mit einem Screenshot: „Warum reparieren Sie das einen Monat lang?“ - „Ja, wir haben die ganze Zeit nach Ihrem Käfer gesucht“, „Na ja, ich bin heute wieder darauf gestoßen, aber ich konnte es nicht noch einmal wiederholen“...

Im Allgemeinen weiß man nie, wo ein Screenshot eines Dialogs mit dem Support landet, und wenn jemand um Unterstützung klopft, hat er ein Problem. Sie können Ihre Einstellung verbessern. Versuche es wenigstens.

Ja, wir wissen, dass unser Support nicht perfekt ist, aber ich würde gerne glauben, dass er ausreichende Geschwindigkeit mit ausreichender Qualität verbindet. Und es erhöht nicht die Tarifpreise für diejenigen, die darauf verzichten können.

Wir machen den Support günstiger und versuchen, die Qualität nicht zu verlieren

Source: habr.com

Kommentar hinzufügen