Big data big billing : à propos du BigData dans les télécoms

En 2008, le BigData était un nouveau terme et une tendance à la mode. En 2019, le BigData est devenu un objet commercial, une source de profit et un motif de nouvelle législation.

L'automne dernier, le gouvernement russe a prĂ©sentĂ© un projet de loi visant Ă  rĂ©glementer le Big Data. Il est interdit d'identifier des personnes par des informations, mais cette identification est autorisĂ©e Ă  la demande des agences fĂ©dĂ©rales. Le traitement de Big Data pour des tiers ne peut ĂȘtre effectuĂ© qu'aprĂšs notification au Roskomnadzor. La loi s'applique aux entreprises disposant de plus de 100 XNUMX adresses rĂ©seau. Et, bien sĂ»r, que serions-nous sans registres ? Il est proposĂ© d'en crĂ©er un avec une liste d'opĂ©rateurs de bases de donnĂ©es. Si auparavant le Big Data n'Ă©tait pas pris au sĂ©rieux par tous, il faudra dĂ©sormais en tenir compte.

En tant que directeur d'une société de développement de solutions de facturation qui traite ce BigData, je ne peux ignorer la base de données. Je vais aborder le Big Data à travers le prisme des opérateurs télécoms, dont les systÚmes de facturation font transiter quotidiennement des flux d'informations concernant des milliers d'abonnés.

ThéorÚme

Commençons par un problĂšme mathĂ©matique : dĂ©montrons d'abord que les donnĂ©es des opĂ©rateurs tĂ©lĂ©coms peuvent ĂȘtre qualifiĂ©es de BigDat. Le Big Data est gĂ©nĂ©ralement caractĂ©risĂ© par trois caractĂ©ristiques VVV, bien que dans les interprĂ©tations libres, le nombre de « V Â» atteigne sept.

Volume. Le MVNO de Rostelecom dessert Ă  lui seul plus d'un million d'abonnĂ©s. Les principaux opĂ©rateurs hĂ©bergeurs traitent les donnĂ©es de 44 Ă  78 millions de personnes. Le trafic augmente chaque seconde : au premier trimestre 2019, les abonnĂ©s ont dĂ©jĂ  surfĂ© sur 3,3 milliards de Go depuis leurs tĂ©lĂ©phones portables.

Vitesse. Personne ne peut mieux vous renseigner sur la dynamique que les statistiques, je vais donc passer en revue les prĂ©visions de Cisco. D'ici 2021, 20 % du trafic IP sera mobile ; ce trafic sera presque multipliĂ© par trois en cinq ans. Un tiers des connexions mobiles seront M2M ; le dĂ©veloppement de l'IoT entraĂźnera une multiplication par six du nombre de connexions. L'Internet des objets deviendra non seulement rentable, mais aussi un secteur gourmand en ressources, ce qui incitera certains opĂ©rateurs Ă  s'y concentrer exclusivement. Ceux qui dĂ©velopperont l'IoT comme un service distinct recevront un trafic deux fois plus important.

VariĂ©tĂ©. La diversitĂ© est un concept subjectif, mais les opĂ©rateurs tĂ©lĂ©coms connaissent pratiquement tout de leurs abonnĂ©s : du nom et des informations de passeport au modĂšle de tĂ©lĂ©phone, en passant par les achats, les lieux visitĂ©s et les centres d'intĂ©rĂȘt. Les fichiers multimĂ©dias sont conservĂ©s six mois conformĂ©ment Ă  la loi de Yarovaya. Partons donc du principe que les donnĂ©es collectĂ©es sont diverses.

Logiciel et méthodologie

Les fournisseurs sont parmi les principaux consommateurs de BigData ; la plupart des mĂ©thodes d'analyse du Big Data sont donc applicables au secteur des tĂ©lĂ©communications. Une autre question est de savoir qui est prĂȘt Ă  investir dans le dĂ©veloppement du Machine Learning, de l'IA, du Deep Learning, ainsi que dans les centres de donnĂ©es et l'exploration de donnĂ©es. Travailler avec une base de donnĂ©es nĂ©cessite une infrastructure et une Ă©quipe, dont les coĂ»ts ne sont pas Ă  la portĂ©e de tous. Les entreprises disposant dĂ©jĂ  d'un stockage interne ou dĂ©veloppant une mĂ©thodologie de gouvernance des donnĂ©es devraient miser sur le BigData. Pour celles qui ne sont pas encore prĂȘtes Ă  investir Ă  long terme, je conseille de construire progressivement l'architecture logicielle et d'installer les composants un par un. Les modules lourds et Hadoop peuvent ĂȘtre laissĂ©s pour la fin. Rares sont ceux qui achĂštent une solution clĂ© en main pour des tĂąches telles que la qualitĂ© des donnĂ©es et l'exploration de donnĂ©es ; les entreprises adaptent gĂ©nĂ©ralement le systĂšme Ă  leurs spĂ©cificitĂ©s et Ă  leurs besoins, elles-mĂȘmes ou avec l'aide de dĂ©veloppeurs.

Mais toutes les facturations ne peuvent pas ĂȘtre modifiĂ©es pour fonctionner avec le BigData. Ou plutĂŽt, elles ne sont pas accessibles Ă  tous. Rares sont ceux qui le peuvent.

Trois signes indiquant qu’un systĂšme de facturation a une chance de devenir un outil de traitement de base de donnĂ©es :

  • ÉvolutivitĂ© horizontale. Les logiciels doivent ĂȘtre flexibles – il s'agit de big data. L'augmentation du volume d'informations doit s'accompagner d'une augmentation proportionnelle du matĂ©riel du cluster.
  • TolĂ©rance aux pannes. Les systĂšmes prĂ©payĂ©s sĂ©rieux sont gĂ©nĂ©ralement tolĂ©rants aux pannes par dĂ©faut : la facturation est dĂ©ployĂ©e dans un cluster rĂ©parti sur plusieurs sites afin qu'ils s'assurent automatiquement mutuellement. Le cluster Hadoop doit Ă©galement disposer de suffisamment d'ordinateurs en cas de panne d'un ou plusieurs d'entre eux.
  • LocalitĂ©. Les donnĂ©es doivent ĂȘtre stockĂ©es et traitĂ©es sur un seul site. serveurAutrement, le transfert de donnĂ©es peut s'avĂ©rer coĂ»teux. Une approche courante consiste Ă  utiliser MapReduce : stockage HDFS et traitement par Spark. IdĂ©alement, le logiciel devrait s'intĂ©grer parfaitement Ă  l'infrastructure du centre de donnĂ©es et remplir trois fonctions : collecter, organiser et analyser les informations.

Équipe

L'Ă©quipe dĂ©cide de la nature, de la mĂ©thode et de l'objectif du traitement du Big Data par le programme. Elle se compose souvent d'une seule personne : un data scientist. Cependant, Ă  mon avis, le package minimum d'employĂ©s pour le BigData comprend Ă©galement un chef de produit, un ingĂ©nieur de donnĂ©es et un manager. Le premier comprend les services, traduit le langage technique en langage humain et inversement. L'ingĂ©nieur de donnĂ©es donne vie aux modĂšles en Java/Scala et expĂ©rimente le Machine Learning. Le manager coordonne, fixe les objectifs et contrĂŽle les Ă©tapes.

ProblĂšmes

C'est gĂ©nĂ©ralement l'Ă©quipe BigData qui rencontre des difficultĂ©s pour collecter et traiter les donnĂ©es. Il est nĂ©cessaire d'expliquer au programme ce qu'il faut collecter et comment les traiter ; pour cela, il faut d'abord comprendre le fonctionnement. Et pour les fournisseurs, tout n'est pas si simple. Je vais vous prĂ©senter ces difficultĂ©s en prenant l'exemple de la rĂ©duction du taux de dĂ©sabonnement : c'est prĂ©cisĂ©ment ce que les opĂ©rateurs tĂ©lĂ©coms cherchent Ă  rĂ©soudre avec le BigData.

DĂ©finition des tĂąches. Une spĂ©cification technique bien rĂ©digĂ©e et une comprĂ©hension diffĂ©rente des termes sont un problĂšme rĂ©current, et pas seulement pour les freelances. MĂȘme les abonnĂ©s « abandonnĂ©s Â» peuvent ĂȘtre interprĂ©tĂ©s diffĂ©remment : ceux qui n'ont pas utilisĂ© les services de l'opĂ©rateur depuis un mois, six mois ou un an. Pour crĂ©er un MVP basĂ© sur des donnĂ©es historiques, il est nĂ©cessaire de comprendre la frĂ©quence de retour des abonnĂ©s sortants, c'est-Ă -dire ceux qui ont essayĂ© des connexions auprĂšs d'autres opĂ©rateurs ou qui ont quittĂ© la ville pour utiliser un autre numĂ©ro. Autre question importante : combien de temps avant le dĂ©part prĂ©vu d'un abonnĂ© le fournisseur doit-il dĂ©terminer ce dĂ©lai et agir ? Six mois, c'est trop tĂŽt, une semaine, c'est trop tard.

Substitution de concepts. Habituellement, les opĂ©rateurs identifient un client par son numĂ©ro de tĂ©lĂ©phone ; il est donc logique que les fonctionnalitĂ©s soient tĂ©lĂ©chargĂ©es par ce dernier. Mais qu'en est-il du compte personnel ou du numĂ©ro de l'application de service ? Il est nĂ©cessaire de dĂ©terminer quelle unitĂ© considĂ©rer comme client afin que les donnĂ©es enregistrĂ©es dans le systĂšme de l'opĂ©rateur soient identiques. L'Ă©valuation de la valeur du client est Ă©galement sujette Ă  caution : quel abonnĂ© est le plus prĂ©cieux pour l'entreprise, quel utilisateur nĂ©cessite davantage d'efforts de fidĂ©lisation, et lesquels « s'envoleront Â» de toute façon et pour lesquels il est inutile de consacrer des ressources.

Manque d'information. Tous les employĂ©s du fournisseur ne sont pas capables d'expliquer Ă  l'Ă©quipe BigData ce qui influence prĂ©cisĂ©ment la perte d'abonnĂ©s et comment les facteurs possibles sont calculĂ©s dans la facturation. MĂȘme s'ils en citent un – l'ARPU –, il s'avĂšre qu'il peut ĂȘtre calculĂ© de diffĂ©rentes maniĂšres : soit par les paiements pĂ©riodiques du client, soit par des frais de facturation automatique. Et au fil du travail, un million d'autres questions se posent : le modĂšle couvre-t-il tous les clients ? Quel est le prix Ă  payer pour fidĂ©liser un client ? Est-il judicieux d'envisager des modĂšles alternatifs ? Que faire des clients artificiellement fidĂ©lisĂ©s par erreur ?

Établissement d'objectifs. Je connais trois types d’erreurs liĂ©es aux rĂ©sultats qui frustrent les opĂ©rateurs avec la base de donnĂ©es.

  1. Le fournisseur investit dans le BigData, traite des gigaoctets d'informations, mais obtient un rĂ©sultat qui aurait pu ĂȘtre obtenu Ă  moindre coĂ»t. Il utilise des schĂ©mas et des modĂšles simples, ainsi que des analyses primitives. Le coĂ»t est plusieurs fois supĂ©rieur, mais le rĂ©sultat est le mĂȘme.
  2. L'opĂ©rateur reçoit des donnĂ©es multiformes en sortie, mais ne sait pas comment les exploiter. L'analyse est lĂ , claire et volumineuse, mais elle est dĂ©nuĂ©e de sens. Le rĂ©sultat final n'est pas rĂ©flĂ©chi et ne peut pas rĂ©pondre Ă  l'objectif de « traitement des donnĂ©es Â». Le traitement ne suffit pas : l'analyse doit devenir la base de la mise Ă  jour des processus mĂ©tier.
  3. Des processus mĂ©tier obsolĂštes et des logiciels inadaptĂ©s aux nouvelles finalitĂ©s peuvent constituer un obstacle Ă  l'utilisation de l'analyse BigData. Cela signifie que vous avez Ă©chouĂ© au stade de la prĂ©paration : vous n'avez pas rĂ©flĂ©chi Ă  l'algorithme des actions et aux Ă©tapes de mise en Ɠuvre du BigData.

Pourquoi

En parlant de rĂ©sultats, je vais passer en revue les mĂ©thodes d’utilisation et de monĂ©tisation du BigData que les opĂ©rateurs de tĂ©lĂ©communications utilisent dĂ©jĂ .
Les fournisseurs prévoient non seulement le flux sortant des abonnés, mais également les charges sur les stations de base.

  1. Les informations sur les mouvements, l'activitĂ© et les frĂ©quences des abonnĂ©s sont analysĂ©es. RĂ©sultat : rĂ©duction du nombre de surcharges grĂące Ă  l'optimisation et Ă  la modernisation des infrastructures problĂ©matiques.
  2. Les opérateurs télécoms utilisent les informations de géolocalisation des abonnés et de densité de trafic lors de l'ouverture de points de vente. Ainsi, l'analyse BigData est déjà utilisée par MTS et VimpelCom pour planifier l'implantation de nouveaux bureaux.
  3. Les fournisseurs monétisent leurs propres Big Data en les proposant à des entreprises tierces. Les principaux clients des opérateurs BigData sont les banques commerciales. Grùce à la base de données, ils suivent les activités suspectes sur la carte SIM de l'abonné, à laquelle les cartes sont liées, et utilisent des services de notation des risques, de vérification et de surveillance. En 2017, le gouvernement de Moscou a demandé à Tele2 d'analyser la dynamique des mouvements basée sur le BigData pour la planification des infrastructures techniques et de transport.
  4. L'analyse BigData est une mine d'or pour les marketeurs, qui peuvent crĂ©er des campagnes publicitaires personnalisĂ©es pour des milliers de groupes d'abonnĂ©s s'ils le souhaitent. Les opĂ©rateurs tĂ©lĂ©coms agrĂšgent les profils sociaux, les centres d'intĂ©rĂȘt et les modĂšles comportementaux des abonnĂ©s, puis exploitent les BigData collectĂ©es pour attirer de nouveaux clients. Cependant, pour la promotion et la planification des relations publiques Ă  grande Ă©chelle, la facturation n'offre pas toujours les fonctionnalitĂ©s nĂ©cessaires : le programme doit prendre en compte simultanĂ©ment de nombreux facteurs, en plus d'informations dĂ©taillĂ©es sur les clients.

Si certains considĂšrent encore le Big Data comme un vain mot, les « Big Four Â» en tirent dĂ©jĂ  profit. MTS a engrangĂ© 14 milliards de roubles en six mois grĂące au traitement du Big Data, et Tele2 a multipliĂ© par trois et demi son chiffre d'affaires issu de projets. Le Big Data, autrefois tendance, devient un incontournable, qui va restructurer toute la structure des opĂ©rateurs tĂ©lĂ©coms.

Source: habr.com

Achetez un hĂ©bergement fiable pour les sites avec protection DDoS, serveurs VPS VDS đŸ”„ Achetez un hĂ©bergement web fiable avec protection DDoS, serveurs VPS et VDS | ProHoster