Big Data Big Billing: sui BigData nelle telecomunicazioni

Nel 2008, BigData era un nuovo termine e una tendenza alla moda. Nel 2019 i BigData sono oggetto di vendita, fonte di guadagno e motivo di nuove fatture.

Lo scorso autunno, il governo russo ha avviato un disegno di legge per regolamentare i big data. Le persone non possono essere identificate dalle informazioni, ma possono farlo su richiesta delle autorità federali. L'elaborazione dei BigData per terzi avviene solo dopo la notifica a Roskomnadzor. Sono soggette alla legge le aziende che hanno più di 100mila indirizzi di rete. E, naturalmente, dove senza registri, dovrebbe crearne uno con un elenco di operatori di database. E se prima questi Big Data non venivano presi sul serio da tutti, ora bisognerà tenerne conto.

Io, in qualità di direttore di una società di sviluppo della fatturazione che elabora proprio questi Big Data, non posso ignorare il database. Penserò ai big data attraverso il prisma degli operatori di telecomunicazioni, attraverso i cui sistemi di fatturazione passano ogni giorno flussi di informazioni su migliaia di abbonati.

Teorema

Cominciamo, come in un problema di matematica: prima dimostriamo che i dati degli operatori di telecomunicazioni possono essere chiamati BigDat. Solitamente i big data sono caratterizzati da tre caratteristiche VVV, anche se nelle libere interpretazioni il numero delle “V” arriva a sette.

Volume. Il solo MVNO di Rostelecom serve più di un milione di abbonati. I principali operatori host gestiscono dati per un numero compreso tra 44 e 78 milioni di persone. Il traffico cresce ogni secondo: nel primo trimestre del 2019 gli abbonati hanno già effettuato l’accesso da cellulare a 3,3 miliardi di GB.

Velocità. Nessuno può raccontarti le dinamiche meglio delle statistiche, quindi esaminerò le previsioni di Cisco. Entro il 2021, il 20% del traffico IP sarà destinato al traffico mobile: quasi triplicherà in cinque anni. Un terzo delle connessioni mobili sarà M2M: lo sviluppo dell’IoT porterà a un aumento di sei volte delle connessioni. L’Internet delle cose diventerà non solo redditizio, ma anche ad alta intensità di risorse, quindi alcuni operatori si concentreranno solo su di esso. E coloro che svilupperanno l’IoT come servizio separato riceveranno il doppio del traffico.

Varietà. La diversità è un concetto soggettivo, ma gli operatori di telecomunicazioni sanno davvero quasi tutto dei loro abbonati. Dal nome e i dettagli del passaporto al modello di telefono, agli acquisti, ai luoghi visitati e agli interessi. Secondo la legge Yarovaya, i file multimediali vengono archiviati per sei mesi. Prendiamo quindi come assioma che i dati raccolti siano variegati.

Software e metodologia

I fornitori sono uno dei principali consumatori di BigData, quindi la maggior parte delle tecniche di analisi dei Big Data sono applicabili al settore delle telecomunicazioni. Un’altra domanda è chi è pronto a investire nello sviluppo di ML, AI, Deep Learning, investire in data center e data mining. Il lavoro a tutti gli effetti con un database è costituito da un'infrastruttura e da un team, i cui costi non tutti possono permettersi. Le imprese che hanno già un magazzino aziendale o stanno sviluppando una metodologia di Data Governance dovrebbero scommettere sui BigData. Per coloro che non sono ancora pronti per investimenti a lungo termine, consiglio di costruire gradualmente l'architettura del software e installare i componenti uno per uno. Puoi lasciare i moduli pesanti e Hadoop per ultimi. Poche persone acquistano una soluzione già pronta per problemi come Data Quality e Data Mining; le aziende generalmente personalizzano il sistema in base alle proprie specifiche ed esigenze specifiche, da sole o con l'aiuto degli sviluppatori.

Ma non tutte le fatture possono essere modificate per funzionare con BigData. O meglio, non solo tutto è modificabile. Poche persone possono farlo.

Tre segnali indicano che un sistema di fatturazione ha la possibilità di diventare uno strumento di elaborazione del database:

  • Scalabilità orizzontale. Il software deve essere flessibile: stiamo parlando di big data. Un aumento della quantità di informazioni dovrebbe essere trattato con un aumento proporzionale dell'hardware nel cluster.
  • Tolleranza ai guasti. I sistemi prepagati seri sono generalmente tolleranti ai guasti per impostazione predefinita: la fatturazione viene distribuita in un cluster in diverse geolocalizzazioni in modo che si assicurino automaticamente a vicenda. Dovrebbero inoltre esserci abbastanza computer nel cluster Hadoop nel caso in cui uno o più falliscano.
  • Località. I dati devono essere archiviati ed elaborati su un server, altrimenti potresti andare in rovina durante il trasferimento dei dati. Uno dei popolari schemi di approccio Map-Reduce: negozi HDFS, processi Spark. Idealmente, il software dovrebbe integrarsi perfettamente nell'infrastruttura del data center ed essere in grado di fare tre cose in una: raccogliere, organizzare e analizzare le informazioni.

Squadra

Cosa, come e per quale scopo il programma elaborerà i big data viene deciso dal team. Spesso è composto da una sola persona: un data scientist. Anche se, a mio avviso, il pacchetto minimo di dipendenti per i Big Data prevede anche un Product Manager, un Data Engineer e un Manager. Il primo comprende i servizi, traduce il linguaggio tecnico in linguaggio umano e viceversa. Data Engineer dà vita ai modelli utilizzando Java/Scala e sperimenta con il machine learning. Il manager coordina, fissa gli obiettivi e controlla le fasi.

Problematica

È da parte del team BigData che di solito sorgono problemi durante la raccolta e l'elaborazione dei dati. Il programma deve spiegare cosa raccogliere e come elaborarlo: per spiegarlo, devi prima capirlo tu stesso. Ma per i fornitori le cose non sono così semplici. Sto parlando dei problemi usando l'esempio del compito di ridurre il tasso di abbandono degli abbonati: questo è ciò che gli operatori di telecomunicazioni stanno cercando di risolvere, in primo luogo, con l'aiuto dei Big Data.

Definendo gli obiettivi. Specifiche tecniche ben scritte e diverse interpretazioni dei termini sono state una seccatura secolare non solo per i liberi professionisti. Anche gli abbonati "abbandonati" possono essere interpretati in modi diversi, come coloro che non hanno utilizzato i servizi dell'operatore per un mese, sei mesi o un anno. E per creare un MVP basato su dati storici, è necessario comprendere la frequenza dei ritorni degli abbonati dall'abbandono, ovvero coloro che hanno provato altri operatori o hanno lasciato la città e hanno utilizzato un numero diverso. Un'altra domanda importante: quanto tempo prima della partenza prevista dell'abbonato il fornitore dovrebbe determinarlo e agire? Sei mesi sono troppo presto, una settimana è troppo tardi.

Sostituzione di concetti. In genere, gli operatori identificano un cliente tramite il numero di telefono, quindi è logico che i segnali vengano caricati utilizzandolo. E il tuo account personale o il numero di richiesta del servizio? È necessario decidere quale unità prendere come cliente in modo che i dati nel sistema dell’operatore non varino. Anche valutare il valore di un cliente è discutibile: quale abbonato è più prezioso per l'azienda, quale utente richiede maggiori sforzi per mantenerlo e quali “cadranno” in ogni caso e non ha senso spendere risorse su di essi.

Mancanza di informazioni. Non tutti i dipendenti del fornitore sono in grado di spiegare al team BigData cosa influisce concretamente sul tasso di abbandono degli abbonati e come vengono calcolati i possibili fattori di fatturazione. Anche se ne hanno nominato uno - ARPU - risulta che può essere calcolato in diversi modi: tramite pagamenti periodici del cliente o tramite addebiti di fatturazione automatici. E nel processo di lavoro sorgono un milione di altre domande. Il modello copre tutti i clienti, qual è il prezzo per mantenere un cliente, ha senso pensare a modelli alternativi e cosa fare con i clienti che sono stati erroneamente trattenuti artificialmente.

Impostazione degli obiettivi. Conosco tre tipi di errori di risultato che causano frustrazione negli operatori con il database.

  1. Il fornitore investe in BigData, elabora gigabyte di informazioni, ma ottiene un risultato che avrebbe potuto essere ottenuto a un prezzo inferiore. Vengono utilizzati diagrammi e modelli semplici e analisi primitive. Il costo è molte volte più alto, ma il risultato è lo stesso.
  2. L'operatore riceve in output dati sfaccettati, ma non capisce come utilizzarli. C'è l'analisi: eccola qui, comprensibile e voluminosa, ma non serve. Il risultato finale, che non può consistere nell’obiettivo di “elaborare i dati”, non è stato pensato a fondo. Non basta elaborare: l’analisi dovrebbe diventare la base per aggiornare i processi aziendali.
  3. Gli ostacoli all’utilizzo dell’analisi BigData possono essere processi aziendali obsoleti e software inadatti a nuovi scopi. Ciò significa che hanno commesso un errore nella fase di preparazione: non hanno pensato all'algoritmo delle azioni e alle fasi di introduzione dei Big Data nel lavoro.

Per cosa?

A proposito di risultati. Esaminerò le modalità di utilizzo e monetizzazione dei Big Data che gli operatori di telecomunicazioni stanno già utilizzando.
I fornitori prevedono non solo il deflusso degli abbonati, ma anche il carico sulle stazioni base.

  1. Vengono analizzate le informazioni sui movimenti degli abbonati, sull'attività e sui servizi di frequenza. Risultato: riduzione del numero di sovraccarichi grazie all'ottimizzazione e alla modernizzazione delle aree problematiche dell'infrastruttura.
  2. Gli operatori di telecomunicazioni utilizzano le informazioni sulla geolocalizzazione degli abbonati e sulla densità del traffico quando aprono punti vendita. Pertanto, le analisi BigData sono già utilizzate da MTS e VimpelCom per pianificare l’ubicazione dei nuovi uffici.
  3. I fornitori monetizzano i propri big data offrendoli a terzi. I principali clienti degli operatori BigData sono le banche commerciali. Utilizzando il database, monitorano le attività sospette della carta SIM dell’abbonato a cui sono collegate le carte e utilizzano servizi di valutazione, verifica e monitoraggio del rischio. E nel 2017 il governo di Mosca ha richiesto dinamiche di movimento basate sui dati BigData di Tele2 per pianificare le infrastrutture tecniche e di trasporto.
  4. L'analisi dei BigData è una miniera d'oro per gli esperti di marketing, che possono creare campagne pubblicitarie personalizzate per fino a migliaia di gruppi di iscritti, se lo desiderano. Le società di telecomunicazioni aggregano profili social, interessi dei consumatori e modelli comportamentali degli abbonati, quindi utilizzano i BigData raccolti per attirare nuovi clienti. Ma per la promozione su larga scala e la pianificazione delle PR, la fatturazione non ha sempre funzionalità sufficienti: il programma deve tenere conto di molti fattori contemporaneamente alle informazioni dettagliate sui clienti.

Mentre alcuni considerano ancora i BigData una frase vuota, i Big Four ci stanno già guadagnando. MTS guadagna 14 miliardi di rubli dall'elaborazione dei big data in sei mesi e Tele2 ha aumentato le entrate dai progetti di tre volte e mezzo. I BigData si trasformano da tendenza in un must have, in base al quale verrà ricostruita l'intera struttura degli operatori di telecomunicazioni.

Fonte: habr.com

Aggiungi un commento