Malipo makubwa ya data: kuhusu BigData katika mawasiliano ya simu

Mnamo 2008 BigData ilikuwa neno jipya na mwelekeo wa mtindo. Mnamo 2019, BigData ni kitu cha kuuza, chanzo cha faida na sababu ya bili mpya.

Msimu wa vuli uliopita, serikali ya Urusi ilianzisha mswada wa kudhibiti data kubwa. Ni marufuku kutambua watu kutoka kwa habari, lakini inaruhusiwa kufanya hivyo kwa ombi la mamlaka ya shirikisho. Usindikaji BigData kwa wahusika wa tatu - tu baada ya taarifa ya Roskomnadzor. Kampuni zilizo na anwani zaidi ya elfu 100 za mtandao ziko chini ya sheria. Na, bila shaka, ambapo bila usajili - inatakiwa kuunda moja na orodha ya waendeshaji wa database. Na ikiwa kabla ya BigData hiyo haikuchukuliwa kwa uzito na kila mtu, sasa itabidi kuhesabiwa.

Mimi, kama mkurugenzi wa kampuni ya ukuzaji bili inayochakata BigData hii, siwezi kupuuza hifadhidata. Nitafikiria juu ya data kubwa kupitia prism ya waendeshaji wa mawasiliano ya simu, kupitia mifumo yao ya utozaji mtiririko wa habari kuhusu maelfu ya waliojisajili kila siku.

Nadharia

Wacha tuanze, kama katika shida ya hesabu: kwanza, tunathibitisha kuwa data ya waendeshaji simu inaweza kuitwa BigDat. Data kubwa ya kawaida ina sifa ya vipengele vitatu vya VVV, ingawa katika tafsiri za bure idadi ya "V" ilifikia hadi saba.

kiasi. MVNO ya Rostelecom pekee hutumikia zaidi ya wanachama milioni. Waendeshaji waandaji wakuu huchakata data kutoka kwa watu milioni 44 hadi milioni 78. Trafiki inaongezeka kila sekunde: katika robo ya kwanza ya 2019, watumiaji tayari wametumia GB bilioni 3,3 kutoka kwa simu za rununu.

Kasi. Hakuna mtu bora kuliko takwimu atasema juu ya mienendo, kwa hivyo nitapitia utabiri wa Cisco. Kufikia 2021, 20% ya trafiki ya IP itaenda kwa trafiki ya rununu - itakuwa karibu mara tatu katika miaka mitano. Theluthi moja ya miunganisho ya rununu itakuwa kwenye M2M - ukuzaji wa IoT utasababisha ongezeko la mara sita la viunganisho. Mtandao wa Mambo hautakuwa wa faida tu, bali pia rasilimali nyingi, kwa hivyo waendeshaji wengine watazingatia tu. Na wale wanaoendeleza IoT kama huduma tofauti watapata trafiki mara mbili.

Tofauti. Anuwai ni dhana inayojitegemea, lakini waendeshaji wa mawasiliano ya simu wanajua karibu kila kitu kuhusu watumizi wao. Kutoka kwa jina na maelezo ya pasipoti hadi mfano wa simu, ununuzi, maeneo yaliyotembelewa na maslahi. Kwa mujibu wa sheria ya Yarovaya, faili za vyombo vya habari huhifadhiwa kwa miezi sita. Kwa hivyo wacha tuchukue kama axiom kwamba data iliyokusanywa ni tofauti.

Programu na mbinu

Watoa huduma ni mmoja wa watumiaji wakuu wa BigData, kwa hivyo mbinu kubwa zaidi za uchambuzi wa data zinatumika kwa tasnia ya mawasiliano ya simu. Swali lingine ni nani yuko tayari kuwekeza katika maendeleo ya ML, AI, Deep Learning, kuwekeza katika vituo vya data na uchimbaji wa data. Kazi kamili na hifadhidata ina miundombinu na timu, gharama ambazo sio kila mtu anayeweza kumudu. Inafaa kuweka dau kwenye BigData kwa makampuni ambayo tayari yana hifadhi ya shirika au kuendeleza mbinu ya Udhibiti wa Data. Kwa wale ambao bado hawajawa tayari kwa uwekezaji wa muda mrefu, nakushauri hatua kwa hatua ujenge usanifu wa programu na usakinishe vipengele moja kwa moja. Moduli nzito na Hadoop zinaweza kuachwa mwishowe. Watu wachache hununua suluhisho ambalo tayari limetengenezwa kwa ajili ya kazi kama vile Ubora wa Data na Uchimbaji Data, makampuni mengi yakiwa yanabinafsisha mfumo ili kuendana na mahususi na mahitaji yao - wao wenyewe au kwa usaidizi wa wasanidi programu.

Lakini sio bili yoyote inayoweza kurekebishwa ili kufanya kazi na BigData. Badala yake, sio kila mtu anaweza kurekebisha. Watu wachache wanaweza kuifanya.

Ishara tatu kwamba mfumo wa utozaji una nafasi ya kuwa zana ya kuchakata hifadhidata:

  • Kuongezeka kwa usawa. Programu lazima iwe rahisi - tunazungumza juu ya data kubwa. Kuongezeka kwa kiasi cha habari kunapaswa kutibiwa na ongezeko la uwiano wa vifaa kwenye nguzo.
  • Uvumilivu wa makosa. Mifumo mikubwa ya kulipia kabla kwa kawaida hustahimili makosa kwa chaguo-msingi: utozaji huwekwa katika kundi katika maeneo kadhaa ya kijiografia ili waweke bima kiotomatiki. Kunapaswa pia kuwa na kompyuta za kutosha kwenye nguzo ya Hadoop ikiwa moja au zaidi zitashindwa.
  • Eneo. Data lazima ihifadhiwe na kuchakatwa kwenye seva hiyo hiyo, vinginevyo unaweza kuharibika wakati wa kuhamisha data. Mojawapo ya miradi maarufu ya mbinu ya Kupunguza Ramani: Duka za HDFS, michakato ya Spark. Kwa hakika, programu inapaswa kuunganishwa kwa urahisi katika miundombinu ya kituo cha data na iweze kufanya mambo matatu kwa moja: kukusanya, kupanga na kuchanganua taarifa.

Timu

Nini, jinsi gani na kwa madhumuni gani programu itashughulikia data kubwa inaamuliwa na timu. Mara nyingi huwa na mtu mmoja - mwanasayansi wa data. Ingawa, kwa maoni yangu, kifurushi cha chini kabisa cha wafanyikazi kwa BigData pia ni pamoja na meneja wa Bidhaa, Mhandisi wa Data na meneja. Wa kwanza anaelewa huduma, hutafsiri lugha ya kiufundi kwa binadamu na kinyume chake. Mhandisi wa Data huboresha miundo na Java/Scala na majaribio ya Kujifunza kwa Mashine. Kiongozi huratibu, huweka malengo, hudhibiti hatua.

Shida

Ni kwa upande wa timu ya BigData ambapo kwa kawaida matatizo hutokea wakati wa kukusanya na kuchakata data. Mpango huo unahitaji kuelezwa nini cha kukusanya na jinsi ya kusindika - ili kuelezea hili, lazima kwanza uelewe mwenyewe. Lakini watoa huduma sio rahisi sana. Ninazungumza juu ya shida kwa kutumia mfano wa kazi ya kupunguza utokaji wa wanachama - ni kazi hii ambayo waendeshaji wa simu wanajaribu kutatua kwa msaada wa BigData kwanza.

Kuweka malengo. TOR iliyotungwa kwa ustadi na uelewa tofauti wa istilahi ni maumivu ya karne nyingi sio tu kwa wafanyikazi huru. Hata wanachama "waliopotea" wanaweza kutafsiriwa kwa njia tofauti - kama kutotumia huduma za operator kwa mwezi, miezi sita au mwaka. Na kuunda MVP kulingana na data ya kihistoria, unahitaji kuelewa mzunguko wa kurudi kwa wanachama kutoka kwa outflow - wale ambao walijaribu uunganisho wa waendeshaji wengine au waliacha jiji na kutumia nambari tofauti. Swali lingine muhimu: ni muda gani kabla ya muda unaotarajiwa wa kuondoka kwa mteja, mtoa huduma anapaswa kuamua hili na kuchukua hatua? Nusu ya mwaka ni mapema sana, wiki tayari imechelewa.

Uingizwaji wa dhana. Kawaida, waendeshaji hutambua mteja kwa nambari ya simu, kwa hiyo ni mantiki kwamba ishara zinapaswa kupakiwa nayo. Vipi kuhusu akaunti ya kibinafsi au nambari ya maombi ya huduma? Inahitajika kuamua ni kitengo gani kichukuliwe kama mteja ili data kwenye mfumo wa waendeshaji isitofautiane. Kukadiria thamani ya mteja pia kunazungumziwa - ni mteja gani anayefaa zaidi kwa kampuni, ni mtumiaji gani anahitaji juhudi zaidi kuhifadhi, na ni nani "ataanguka" kwa hali yoyote na haina maana kutumia rasilimali kumnunua.

Ukosefu wa habari. Si wafanyakazi wote wa watoa huduma wanaoweza kueleza timu ya BigData ni nini hasa kinachoathiri utokaji wa wanaojisajili na jinsi mambo yanayowezekana yanazingatiwa katika utozaji. Hata kama mmoja wao aliitwa - ARPU - inageuka kuwa inaweza kuhesabiwa kwa njia tofauti: ama kwa malipo ya mara kwa mara ya wateja, au kwa malipo ya bili ya moja kwa moja. Na katika mchakato huo, maswali mengine milioni huibuka. Je, mtindo huo unawashughulikia wateja wote, ni gharama gani ya kubaki na mteja, je, inaleta maana kufikiria kupitia mifano mbadala, na nini cha kufanya na wateja ambao wamehifadhiwa kimakosa.

Mpangilio wa malengo. Ninajua aina tatu za makosa yanayohusiana na matokeo ambayo husababisha waendeshaji kufadhaika na hifadhidata.

  1. Mtoa huduma huwekeza kwenye BigData, huchakata gigabaiti za habari, lakini hupokea matokeo ambayo yangeweza kupatikana kwa bei nafuu. Mipango na mifano rahisi, analytics primitive hutumiwa. Gharama ni mara nyingi zaidi, lakini matokeo ni sawa.
  2. Opereta hupokea data nyingi kwenye pato, lakini haelewi jinsi ya kuzitumia. Kuna uchanganuzi - hii hapa, inaeleweka na ina nguvu, lakini hakuna maana kutoka kwake. Matokeo ya mwisho hayajafikiriwa, ambayo hayawezi kujumuisha lengo la "kusindika data". Usindikaji hautoshi - uchanganuzi unapaswa kuwa msingi wa kusasisha michakato ya biashara.
  3. Kikwazo kwa matumizi ya takwimu za BigData kinaweza kuwa michakato ya biashara iliyopitwa na wakati na programu ambayo haifai kwa madhumuni mapya. Hii inamaanisha kuwa walifanya makosa katika hatua ya maandalizi - hawakufikiria juu ya kanuni ya vitendo na hatua za kuanzisha BigData kazini.

Kwa nini

Akizungumzia matokeo. Nitapitia njia za kutumia na kuchuma mapato kwa BigData, ambayo waendeshaji wa mawasiliano ya simu tayari wanatumia.
Watoa huduma wanatabiri si tu outflow ya wanachama, lakini pia mzigo kwenye vituo vya msingi.

  1. Habari kuhusu harakati za waliojiandikisha, shughuli na huduma za masafa huchambuliwa. Matokeo: kupunguzwa kwa idadi ya upakiaji kwa sababu ya uboreshaji na uboreshaji wa maeneo ya shida ya miundombinu.
  2. Waendeshaji wa mawasiliano ya simu hutumia habari kuhusu eneo la kijiografia cha wasajili na msongamano wa trafiki wakati wa kufungua vituo vya mauzo. Kwa hivyo uchanganuzi wa BigData tayari unatumiwa na MTS na Vimpelcom kupanga eneo la ofisi mpya.
  3. Watoa huduma huchuma mapato ya data yao kubwa kwa kuitoa kwa makampuni mengine. Wateja wakuu wa waendeshaji BigData ni benki za biashara. Kwa usaidizi wa hifadhidata, wanafuatilia shughuli za kutiliwa shaka za SIM kadi ya mteja ambayo kadi zimeunganishwa, hutumia alama za hatari, huduma za uthibitishaji na ufuatiliaji. Na mwaka wa 2017, serikali ya Moscow iliomba mienendo ya harakati kulingana na data ya BigData kutoka Tele2 ili kupanga miundombinu ya kiufundi na usafiri.
  4. Uchanganuzi wa BigData ni mgodi wa dhahabu kwa wauzaji ambao wanaweza kuunda kampeni za matangazo ya kibinafsi kwa maelfu ya vikundi vya waliojisajili ikiwa wanataka. Kampuni za mawasiliano hujumlisha wasifu wa kijamii, maslahi ya watumiaji, na mifumo ya kitabia ya wanaojisajili, na kisha kutumia BigData iliyokusanywa kuvutia wateja wapya. Lakini kwa ukuzaji wa kiwango kikubwa na upangaji wa PR, utozaji sio kila wakati una utendakazi wa kutosha: mpango lazima uzingatie mambo mengi kwa wakati mmoja na maelezo ya kina kuhusu wateja.

Wakati mtu bado anachukulia BigData kama kifungu tupu, Big Four tayari wanapata pesa juu yake. MTS inapata rubles bilioni 14 kwa usindikaji wa data kubwa katika miezi sita, na Tele2 iliongeza mapato kutoka kwa miradi kwa mara tatu na nusu. BigData inageuka kutoka kwa mwelekeo hadi kuwa lazima iwe nayo, ambayo muundo mzima wa waendeshaji wa mawasiliano ya simu utajengwa upya.

Chanzo: mapenzi.com

Kuongeza maoni