Rendiamo il supporto più economico, cercando di non perdere la qualità

Rendiamo il supporto più economico, cercando di non perdere la qualitàLa modalità fallback (nota anche come IPKVM), che consente di connettersi a un VPS senza RDP direttamente dal livello hypervisor, consente di risparmiare 15-20 minuti a settimana.

La prima e più importante cosa è non far incazzare la gente. In tutto il mondo il supporto è suddiviso in linee e il dipendente è il primo a provare soluzioni tipiche. Se l'attività supera i limiti, trasferiscila sulla seconda riga. Quindi, tra gli amministratori VDS molto spesso ci sono persone che sanno pensare. A differenza di molti altri supporti. Beh, almeno significativamente più spesso. E strutturano bene il biglietto, descrivendo subito tutto quello che serve. Se la prima riga ha gli “occhi offuscati” e ti chiedono accidentalmente di accenderla e spegnerla in risposta, è un fiasco.

Il compito è molto semplice: fornire un supporto adeguato al nostro hosting VDS ad un costo minimo. Perché siamo il fast food del mondo degli hosting provider: nessuna “leccata speciale”, prezzi bassi, qualità normale. Prima C'era già una storia sul fatto che con l'avvento dei bastardi di Instagram che cercavano di automatizzare la gestione degli account e dei proprietari di piccole imprese con contabilità remota e di altre persone non molto avanzate nella tecnologia, la comunicazione "da amministratore a amministratore" ha smesso di funzionare. Ho dovuto cambiare il linguaggio della comunicazione.

Ora ti dirò qualcosa in più sui processi e sugli inevitabili problemi con essi.

Non far incazzare la gente, numero 1

Qualsiasi supporto è una produzione in catena di montaggio. Arriva una candidatura, il dipendente in prima linea cerca subito di riconoscere una situazione tipica che è già accaduta mille volte e che mille volte accadrà ancora. C'è una probabilità del 90% che l'applicazione sia tipica e puoi rispondere premendo letteralmente un paio di pulsanti in modo che il modello venga sostituito. Di solito devi solo scrivere un paio di parole nel modello e il gioco è fatto. Oppure vai all'interfaccia di gestione e premi un paio di pulsanti lì. Nei casi più complessi (trasferimenti da zona a zona, ad esempio), è necessario seguire l'algoritmo.

Ciò che irrita di più le persone, indipendentemente dalle altre qualità di supporto, è la reazione tipica a una richiesta atipica. Arriva un ticket, dove tutto è descritto in dettaglio, ci sono un sacco di dati necessari per tre domande successive, il cliente anticipa un dialogo... E secondo le prime parole, l'addetto all'assistenza con il pilota automatico digita un accordo per sostituire il modello "prova a riavviare, dovrebbe aiutare."

Questo è ciò che apre davvero la mente delle persone, ed è dopo tali situazioni che rimangono le recensioni più negative e i commenti arrabbiati. È chiaro che ci sbagliavamo di grosso, è lì che conosciamo le statistiche. In generale, abbiamo commesso errori in modi diversi, ma questi casi sono sempre semplicemente selvaggi. Anche per noi stessi. Naturalmente vorremmo che ciò non accadesse affatto. Ma in pratica questo non è molto possibile: una volta ogni poche settimane, un dipendente stanco della monotonia premerà i pulsanti divertenti.

Non far incazzare la gente, numero 2

La seconda cosa che apre la mente allo stesso modo è quando nessuno risponde a un ticket per un tempo sufficientemente lungo. In Europa questo comportamento di sostegno è normale: tre giorni prima che un incidente venga accettato al lavoro è più della norma. Anche se sei molto urgente e qualcosa sta bruciando: niente social network, niente telefono, niente messenger, solo e-mail e aspetta il tuo turno. In Russia questo è molto meno comune, ma alcuni biglietti vengono comunque “dimenticati”. All'inizio del lavoro stabiliamo uno SLA per la prima risposta di 15 minuti. E questo è onesto 24 ore su 7, XNUMX giorni su XNUMX. È chiaro che quando l’hosting VDS diventa grande, questo appare. Ma i fornitori di servizi dubbi non ce l'hanno. E all'inizio eravamo solo dubbiosi e solo poi siamo diventati più o meno grandi. Ok, più o meno nella media.

La prima riga è composta da operatori a cui sono stati forniti script e hanno insegnato a reagire a situazioni tipiche. Risolvono rapidamente i problemi e provano entro 15 minuti a rispondere con un'azione tipica oppure segnalano che il ticket è in elaborazione e lo trasferiscono al secondo.

La seconda linea sono gli amministratori di hosting: sanno fare quasi tutto a mano. C'è anche un responsabile dell'assistenza che può fare tutto e qualcosa in più. La terza riga sono gli sviluppatori, ricevono ticket come "risolvi questo nell'interfaccia" o "questo o quell'altro parametro viene preso in considerazione in modo errato".

Ridurre il numero di applicazioni

Per ovvie ragioni, se vuoi fornire supporto a basso costo, non dovresti aumentare la prima riga in modo che le persone possano gestire gli script più velocemente, ma aumentare l'automazione. In modo che invece di persone con copioni ci siano copioni reali. Pertanto, una delle prime cose che abbiamo fatto è stata automatizzare i processi di innalzamento di una macchina virtuale, ridimensionamento in base alle risorse (incluso su e giù il disco, ma non in base alla frequenza del processore) e altre cose simili. Più l'utente può fare dall'interfaccia, più facile sarà convivere con la prima riga e più piccola potrà essere. Quando un utente accede a qualcosa che si trova nel suo account personale, deve farlo e dirgli come può farlo da solo.

Se non hai bisogno di supporto, allora sta facendo un buon lavoro.

La seconda caratteristica, che fa risparmiare molto tempo, è il lungo tempo necessario per compilare la knowledge base. Se l'utente ha un problema che non è incluso nell'elenco delle azioni supportate (molto spesso si tratta di domande a livello di "come installare un server Minecraft" o "Dove configurare un VPS in Win Server"), quindi l'articolo è scritto nella knowledge base. Lo stesso articolo dettagliato è scritto per tutte le richieste strane. Ad esempio, se un utente chiede supporto per rimuovere il firewall integrato di Windows Server, lo inviamo a leggere cosa accadrà se viene effettivamente disabilitato e come modificare le autorizzazioni solo per il software selezionato. Perché il problema di solito risiede nel fatto che qualcosa non può connettersi a causa delle impostazioni e non nel firewall stesso. Ma è molto difficile spiegarlo ogni volta nel dialogo. Ma in qualche modo non voglio disabilitare il firewall, perché molto presto perderemo la macchina virtuale o il client.

Se qualcosa sul software applicativo nella knowledge base diventa molto popolare, allora puoi aggiungere la distribuzione al marketplace in modo che appaia il servizio "configura un server con questo già installato". In realtà, questo è quello che è successo con Docker, ed è quello che è successo con il server Minecraft. Ancora una volta, un pulsante “fammi del bene” nell’interfaccia consente di risparmiare fino a centinaia di biglietti all’anno.

Modalità di emergenza

Dopo questi passaggi, i guasti più gravi che richiedono lavoro manuale rimangono dovuti al fatto che l'utente per qualche motivo ha perso i mezzi di accesso remoto al sistema operativo guest nell'hypervisor. Il caso più comune è semplicemente un'impostazione errata del firewall, il secondo più comune sono alcuni bug che impediscono a Win di avviarsi normalmente e costringono a riavviare in modalità provvisoria. E in modalità provvisoria, RDP non è disponibile per impostazione predefinita.

Abbiamo creato una modalità di emergenza per questo caso. Infatti, solitamente per accedere ad una macchina VDS è necessario disporre di una sorta di client per il lavoro remoto. Molto spesso parliamo di accesso alla console, RDP, VNC o qualcosa di simile. Lo svantaggio di questi metodi è che non funzionano senza un sistema operativo. Ma a livello di hypervisor possiamo ricevere l'immagine sullo schermo e trasmettere lì la pressione della tastiera! È vero, questo carica parecchio il processore (a causa della trasmissione video effettiva), ma ti consente di ottenere il risultato desiderato.

Pertanto, abbiamo concesso l'accesso alla modalità di emergenza a tutti gli utenti, ma è limitata in termini di durata di utilizzo continuo. Fortunatamente, come dimostra la pratica, questa volta è sufficiente per riavviare e correggere qualcosa.

Il risultato è un numero ancora inferiore di ticket di supporto. E laddove l’amministratore può risolvere il ticket da solo, il supporto non deve intervenire e capirlo.

Problemi rimanenti

Molto spesso, gli utenti pensano che il supporto stia spingendo qualcosa su di loro. Sfortunatamente, non si può fare nulla al riguardo (o non abbiamo trovato nulla). I due esempi più comuni sono i limiti delle risorse e la protezione DDoS.

Ogni macchina virtuale ha limiti sul carico del disco, sulla memoria e sul traffico consentito. La possibilità di impostare dei limiti è specificata nell'offerta, ma i limiti stessi sono selezionati in modo che la maggior parte degli utenti possa lavorare tranquillamente senza nemmeno saperlo. Ma se all'improvviso inizi a giocare troppo con il canale e il disco, gli algoritmi avvisano automaticamente l'utente. Dall'aprile dello scorso anno abbiamo rimosso le serrature automatiche. Invece, fissando limiti morbidi per un periodo variabile.

Prima era così: un avvertimento, poi, se l'utente non prestava attenzione, un blocco automatico. E in quel momento la gente si è offesa: “Di cosa stai parlando, è il tuo sistema che è difettoso, non è successo niente!” - e poi puoi provare a capire il software applicativo o offrirti di aumentare il piano tariffario. Non abbiamo l'opportunità di comprendere il funzionamento del software applicativo perché questo va oltre l'ambito del supporto. Anche se i primi casi sono stati risolti insieme agli utenti. Ricordo in particolare quello in cui il truffatore delle visualizzazioni di YouTube aveva un trojan integrato e questo trojan perdeva memoria. Alla fine siamo giunti alla conclusione che non si trattava di Heisenbug, ma di problemi con gli utenti, altrimenti saremmo stati inondati di richieste simili. Ma nessuno ha ancora ammesso di poter superare lui stesso le tariffe.

Una storia simile è con DDoS: scriviamo che tu, caro utente, sei sotto attacco. Collega la protezione, per favore. E l'utente: "Sì, mi stai attaccando tu stesso!" Naturalmente, abbiamo DDoS solo un utente per truffarlo di 300 rubli. È un business redditizio. Sì, lo so, molti grandi siti di hosting nella categoria più costosa includono questa protezione nella tariffa, ma non possiamo farlo: l'economia del fast food impone altri prezzi minimi.

Altrettanto spesso, coloro i cui dati sono stati cancellati sono insoddisfatti del supporto. Nel senso che è stato legittimamente cancellato dopo la scadenza del periodo pagato. Se qualcuno non rinnova il noleggio del VDS, vengono inviate diverse notifiche che spiegano cosa succederà dopo. Una volta completato il pagamento, la macchina virtuale si ferma, ma la sua immagine viene salvata. Arriva un'altra notifica, e poi altre due. L'immagine viene archiviata per altri sette giorni prima di essere eliminata definitivamente. Quindi, c'è una categoria di persone che sono molto insoddisfatte di questo. A partire da "l'amministratore si è dimesso, le notifiche sono state inviate alla sua email, sono state reintegrate" per finire con accuse di frode e minacce di danni fisici. Il motivo sono gli stessi prezzi per tutti gli altri utenti. Se lo conserviamo per un mese, avremo bisogno di più spazio di archiviazione. Ciò significherà prezzi più alti per ogni singolo cliente. E l'economia del fast food... Beh, hai capito. E di conseguenza, sui forum riceviamo recensioni nello spirito di "hanno preso soldi, cancellato dati, truffatori".

Vorrei sottolineare che abbiamo una linea di tariffe premium. Lì, ovviamente, la situazione è diversa, poiché teniamo conto dei desideri del cliente e impostiamo in modo flessibile sia il limite che la cancellazione in caso di mancato pagamento (lo mettiamo in meno, solo per non bloccarlo). Lì è già economicamente fattibile, perché davvero tutto può succedere e mantenere un grande cliente permanente è costoso.

A volte gli utenti sono dannosi. Diverse volte il nostro sistema ha riscontrato guasti con centinaia di macchine virtuali bloccate a causa di alcune azioni chiaramente illegittime dei client. In realtà proprio a causa di tali situazioni avevamo bisogno dei nostri driver di rete per monitorare l'attività di rete e vedere che l'utente non stesse eseguendo un attacco dal suo server. Il monitoraggio di un piano del genere è importante in modo che i confini delle macchine virtuali vicine non vengano violati da ragazzi turbolenti.

Ci sono quelli che semplicemente inviano spam, mina o violano in altro modo l'offerta. Poi bussa per chiedere aiuto e chiede cosa è andato storto e perché l'auto è bloccata. Se il processo nel ticket nello screenshot si chiama "spam sender.exe", probabilmente qualcosa sta andando storto. Circa una volta ogni due settimane riceviamo lamentele da Sony o Lucasfilm (ora Disney) che qualcuno dalla nostra macchina virtuale della nostra gamma di indirizzi IP sta distribuendo un film bruciato. Per questo bloccherai e restituirai immediatamente il denaro rimanente sul conto secondo l'offerta (ti ricordo: la nostra quantizzazione è al secondo, cioè ci sarà sempre un saldo di sicuro). E per riavere i soldi, secondo la legge, bisogna mostrare il passaporto: questo è antiriciclaggio. Per qualche ragione, invece di mostrare il passaporto, i pirati scrivono che abbiamo spremuto loro dei soldi, dimenticandoci di chiarire alcune circostanze.

Oh si. La nostra migliore richiesta dell’anno è: “Posso testare una macchina virtuale per qualche giorno al prezzo di 30 rubli al mese prima dell’acquisto?”

risultato

La prima riga ordina i ticket e risponde con azioni tipiche. E' qui che c'è la maggiore insoddisfazione. Non sarà ancora possibile risolvere questo problema, perché la base per risolverlo è l'automazione dell'hosting, cioè un enorme arretrato. Sì, ne abbiamo più di tanti sul mercato, ma non ancora abbastanza. Pertanto, la cosa migliore che si possa fare è stabilire un monitoraggio di prima linea. Monitoraggio Help Desk: implementazione KPI di prima linea. I ritardi nello SLA sono visibili in tempo reale: chi sta sbagliando, spesso - perché. Grazie a tali avvisi, le applicazioni non vengono mai perse. Sì, al ticket può essere risposto con un modello non in tema, ma questo lo scopriamo già dai feedback.

Se il cliente lo chiede davvero, lo specialista di seconda linea può andare al server e fare lì ciò di cui il cliente ha bisogno (la condizione è la conferma tramite lettera in cui fornirà le informazioni di accesso al server).

Lo facciamo molto raramente e affidiamo questo lavoro solo ai migliori, perché vogliamo avere garanzie che i dati degli utenti non vengano danneggiati. I migliori sono la seconda linea di supporto.

La prima riga ha una base di conoscenza a cui puoi inviare per cercare cose complesse.

Un conto personale ricco di funzioni e una base di conoscenze - e ora siamo riusciti a ridurre il numero di richieste in media a 1–1,5 all'anno per cliente.

La seconda linea solitamente elabora applicazioni complesse che richiedono lavoro manuale. Ciò che è tipico è che quanto più costoso è il piano tariffario, tanto minori saranno le richieste di questo tipo per macchina virtuale. Di solito perché chi può permettersi una tariffa costosa o ha specialisti nello staff, o semplicemente la metà dei problemi non si pone perché c'è abbastanza configurazione per tutto. Ricordo ancora l'eroe che installò il non più vecchio Windows Server su una configurazione con 256 MB di RAM.

La seconda riga ha una serie di kit di distribuzione e una serie di script di automazione. Entrambi possono essere aggiornati secondo necessità.

La seconda linea e i gestori personali delle tariffe VIP possono aggiungere note al profilo del cliente. Se è un amministratore Linux, lo annoteremo. Questo sarà il primo suggerimento: l'utente sa per certo che non si tratterà di un colpo alla gamba, ma di una distruzione controllata.

La terza riga è la più strana. Ad esempio, abbiamo riscontrato un bug che rendeva impossibile l'accesso a una delle funzioni del proprio account personale in Firefox. L'utente ha ricattato direttamente: "Se non risolvi il problema entro 12 ore, scriverò su tutte le recensioni dell'host". A quanto pare, il problema era nell'adblock personalizzato. Dal lato utente, stranamente. Spesso si verificano errori complessi senza dettagli e non possono più essere ripetuti. Ci sono investigatori con uno screenshot: "Perché lo aggiusti per un mese?" - "Sì, abbiamo cercato il tuo bug per tutto questo tempo", "Oh, beh, l'ho trovato di nuovo oggi, ma non potevo ripeterlo di nuovo"...

In generale, non si sa mai dove andrà a finire uno screenshot di un dialogo con il supporto e se una persona bussa per ricevere supporto, allora ha un problema. Puoi migliorare il tuo atteggiamento. Almeno provaci.

Sì, sappiamo che il nostro supporto non è perfetto, ma mi piace credere che combini una velocità sufficiente con una qualità sufficiente. E non aumenta le tariffe per chi può farne a meno.

Rendiamo il supporto più economico, cercando di non perdere la qualità

Fonte: habr.com

Aggiungi un commento