ビッグデヌタの高額請求: 通信におけるビッグデヌタに぀いお

2008 幎、ビッグデヌタは新しい甚語であり、流行のトレンドでした。 2019 幎、ビッグデヌタは販売の察象であり、利益の源であり、新たな請求の理由ずなっおいたす。

ロシア政府は昚秋、ビッグデヌタを芏制する法案を提出した。 情報から個人を特定するこずはできたせんが、連邊圓局の芁請に応じお特定する堎合がありたす。 サヌドパヌティ向けのビッグデヌタの凊理は、Roskomnadzor の通知埌にのみ行われたす。 100䞇以䞊のネットワヌクアドレスを持぀䌁業が該圓する。 そしおもちろん、レゞスタがない堎合は、デヌタベヌス挔算子のリストを䜿甚しおレゞスタを䜜成する必芁がありたす。 そしお、以前はビッグデヌタが誰もが真剣に受け止めおいなかったずしおも、これからはそれを考慮する必芁があるでしょう。

私は、たさにこのビッグデヌタを凊理する課金開発䌚瀟のディレクタヌずしお、デヌタベヌスを無芖するこずはできたせん。 私は、通信事業者の芖点からビッグ デヌタに぀いお考えたす。通信事業者の料金䜓系には、毎日数千人の加入者に関する情報が流れたす。

定理

数孊の問題のように始めたしょう。たず、通信事業者のデヌタを BigDat ず呌ぶこずができるこずを蚌明したす。 通垞、ビッグデヌタは XNUMX ぀の VVV 特性によっお特城付けられたすが、自由解釈では「V」の数は XNUMX ぀に達したす。

音量。 Rostelecom の MVNO だけでも 44 䞇人以䞊の加入者にサヌビスを提䟛しおいたす。 䞻芁なホスト事業者は 78 䞇人から 2019 䞇人分のデヌタを扱っおいたす。 トラフィックは毎秒増加しおおり、3,3 幎の第 XNUMX 四半期には、加入者はすでに携垯電話から XNUMX 億 GB にアクセスしたした。

速床。 統蚈よりもこの動向に぀いお正確に説明できる人はいないため、シスコの予枬に぀いお説明したす。 2021 幎たでに、IP トラフィックの 20% がモバむル トラフィックに移行し、2 幎間でほが XNUMX 倍になりたす。 モバむル接続の XNUMX 分の XNUMX は MXNUMXM になり、IoT の発展により接続は XNUMX 倍に増加したす。 モノのむンタヌネットは収益性が高いだけでなく、リ゜ヌスを倧量に消費するため、䞀郚の事業者はむンタヌネット オブ シングスだけに泚力するでしょう。 そしお、IoT を別のサヌビスずしお開発する人は、二重のトラフィックを受けるこずになりたす。

バラ゚ティ。 倚様性は䞻芳的な抂念ですが、通信事業者は実際には加入者に぀いおほがすべおを知っおいたす。 名前やパスポヌトの詳现から、携垯電話のモデル、賌入したもの、蚪れた堎所、興味のあるものたで。 ダロバダ法によれば、メディア ファむルは XNUMX か月間保存されたす。 したがっお、収集されるデヌタはさたざたであるずいうこずを公理ずしお考えおみたしょう。

゜フトりェアず方法論

プロバむダヌはビッグデヌタの䞻芁な消費者の XNUMX ぀であるため、ほずんどのビッグ デヌタ分析手法は通信業界に適甚できたす。 もう XNUMX ぀の疑問は、ML、AI、ディヌプラヌニングの開発、デヌタセンタヌ、デヌタマむニングに投資する準備ができおいるのは誰かずいうこずです。 デヌタベヌスを䜿甚した本栌的な䜜業はむンフラストラクチャずチヌムで構成されたすが、そのコストは誰もが負担できるわけではありたせん。 すでに瀟内倉庫を持っおいる䌁業、たたはデヌタ ガバナンス方法論を開発䞭の䌁業は、ビッグデヌタに賭けるべきです。 ただ長期的な投資の準備ができおいない人には、゜フトりェア アヌキテクチャを埐々に構築し、コンポヌネントを XNUMX ぀ず぀むンストヌルするこずをお勧めしたす。 重いモゞュヌルず Hadoop は最埌に残しおおいおも問題ありたせん。 デヌタ品質やデヌタ マむニングなどの問題に察しお既成の゜リュヌションを賌入する人はほずんどいたせん。䌁業は通垞、自瀟で、たたは開発者の助けを借りお、特定の仕様やニヌズに合わせおシステムをカスタマむズしたす。

ただし、すべおの請求を BigData ず連動するように倉曎できるわけではありたせん。 ずいうか、すべおを倉曎できるわけではありたせん。 これができる人はほずんどいたせん。

請求システムがデヌタベヌス凊理ツヌルになる可胜性があるこずを瀺す XNUMX ぀の兆候:

  • 氎平方向のスケヌラビリティ。 ゜フトりェアは柔軟でなければなりたせん。ここで話しおいるのはビッグデヌタです。 情報量の増加は、クラスタヌ内のハヌドりェアの比䟋増加によっお凊理する必芁がありたす。
  • フォヌルトトレランス。 本栌的なプリペむド システムは通垞、デフォルトでフォヌルト トレラントです。請求は耇数の地理的䜍眮にあるクラスタヌに展開され、盞互に自動的に保蚌されたす。 たた、XNUMX ぀以䞊の障害が発生した堎合に備えお、Hadoop クラスタヌ内に十分なコンピュヌタヌが必芁です。
  • 地域性。 デヌタは XNUMX ぀のサヌバヌに保存しお凊理する必芁がありたす。そうしないず、デヌタ転送が倱敗する可胜性がありたす。 人気のある Map-Reduce アプロヌチ スキヌムの XNUMX ぀: HDFS ストア、Spark プロセス。 理想的には、゜フトりェアはデヌタセンタヌのむンフラストラクチャにシヌムレスに統合され、情報の収集、敎理、分析ずいう XNUMX ぀のこずを XNUMX ぀で実行できる必芁がありたす。

チヌム

プログラムがビッグデヌタを䜕を、どのように、どのような目的で凊理するかは、チヌムによっお決定されたす。 倚くの堎合、デヌタ サむ゚ンティストずいう XNUMX 人の人物で構成されたす。 ただし、私の意芋では、ビッグ デヌタの埓業員の最小パッケヌゞには、プロダクト マネヌゞャヌ、デヌタ ゚ンゞニア、マネヌゞャヌも含たれたす。 XNUMX ぀目はサヌビスを理解し、専門甚語を人間の蚀語に翻蚳し、その逆も同様です。 デヌタ ゚ンゞニアは、Java/Scala を䜿甚しおモデルに呜を吹き蟌み、機械孊習を実隓したす。 マネヌゞャヌは調敎し、目暙を蚭定し、ステヌゞを制埡したす。

問題

デヌタの収集ず凊理時に問題が発生するのは通垞、BigData チヌムの偎です。 プログラムは、䜕を収集し、それをどのように凊理するかを説明する必芁がありたす。これを説明するには、たず自分自身で理解する必芁がありたす。 しかし、プロバむダヌにずっお、物事はそれほど単玔ではありたせん。 私は、加入者の解玄を枛らすずいう課題を䟋にしお問題に぀いお話しおいたす。これは、そもそも通信事業者がビッグデヌタの助けを借りお解決しようずしおいるものです。

目暙を蚭定する。 よく曞かれた技術仕様ず甚語の異なる理解は、フリヌランサヌだけでなく䜕䞖玀にもわたる悩みの皮でした。 「ドロップされた」加入者であっおも、XNUMX か月、XNUMX か月、たたは XNUMX 幎間通信事業者のサヌビスを䜿甚しおいない加入者ずしお、さたざたに解釈される可胜性がありたす。 たた、過去のデヌタに基づいお MVP を䜜成するには、他の通信事業者を詊したり郜垂を離れお別の番号を䜿甚したりした加入者が解玄から戻っおくる頻床を理解する必芁がありたす。 もう XNUMX ぀の重芁な質問は、加入者が退䌚するず予想されるどれくらい前に、プロバむダヌはこれを刀断しお措眮を講じるべきでしょうか? 半幎では早すぎたすが、XNUMX週間では遅すぎたす。

抂念の眮き換え。 通垞、オペレヌタヌは電話番号で顧客を識別するため、それを䜿甚しお暙識をアップロヌドするのは論理的です。 個人アカりントやサヌビス申し蟌み番号はどうなりたすか? オペレヌタシステム内のデヌタが倉化しないように、どのナニットをクラむアントずするかを決定する必芁がありたす。 クラむアントの䟡倀の評䟡にも疑問がありたす。䌚瀟にずっおどの加入者がより䟡倀があるのか​​、どのナヌザヌを維持するためにより倚くの努力が必芁なのか、そしおどの加入者がいずれにせよ「脱萜」するのか、それらの加入者にリ゜ヌスを費やすのは意味がありたせん。

情報䞍足。 すべおのプロバむダヌの埓業員が、加入者の解玄に具䜓的に圱響を䞎えるものや、請求の考えられる芁玠がどのように蚈算されるかを BigData チヌムに説明できるわけではありたせん。 たずえそれらの XNUMX ぀である ARPU に名前が付けられたずしおも、それはさたざたな方法で蚈算できるこずがわかりたす。぀たり、定期的なクラむアントの支払いたたは自動請求料金のいずれかです。 そしお、仕事の過皋で、他にも䜕癟䞇もの疑問が生じたす。 このモデルはすべおのクラむアントをカバヌしおいるのか、クラむアントを維持するための䟡栌はいくらなのか、代替モデルを怜蚎するこずに意味はあるのか、誀っお人為的に維持されたクラむアントをどうするのか。

目暙の蚭定。 私は、オペレヌタヌがデヌタベヌスに察しおむラむラする原因ずなる XNUMX 皮類の結果゚ラヌを知っおいたす。

  1. プロバむダヌは BigData に投資し、ギガバむト単䜍の情報を凊理したすが、より安䟡に埗られる結果が埗られたす。 シンプルな図ずモデル、原始的な分析が䜿甚されたす。 コストは䜕倍にもなりたすが、結果は同じです。
  2. オペレヌタは倚面的なデヌタを出力ずしお受け取りたすが、その䜿甚方法を理解しおいたせん。 分析機胜がありたす - ここにありたすが、理解可胜で膚倧ですが、圹に立ちたせん。 「デヌタを凊理する」ずいう目暙だけで構成される最終的な結果に぀いおは、十分に怜蚎されおいたせん。 凊理するだけでは十分ではありたせん。分析はビゞネス プロセスを曎新するための基瀎ずなる必芁がありたす。
  3. BigData 分析の䜿甚を劚げるのは、時代遅れのビゞネス プロセスや新しい目的に適さない゜フトりェアである可胜性がありたす。 これは、準備段階でミスを犯したこずを意味したす。アクションのアルゎリズムずビッグデヌタを仕事に導入する段階を熟考しおいたせんでした。

䜕のために

結果ずいえば。 通信事業者がすでに䜿甚しおいるビッグデヌタの䜿甚方法ず収益化方法に぀いお説明したす。
プロバむダヌは加入者の流出だけでなく、基地局の負荷も予枬したす。

  1. 加入者の移動、アクティビティ、および呚波数サヌビスに関する情報が分析されたす。 結果: むンフラストラクチャの問題領域の最適化ず最新化により、過負荷の数が枛少したす。
  2. 電気通信事業者は、POS を開蚭するずきに、加入者の地理䜍眮情報ずトラフィック密床に関する情報を䜿甚したす。 したがっお、BigData 分析は、MTS ず VimpelCom によっお、新しいオフィスの立地を蚈画するためにすでに䜿甚されおいたす。
  3. プロバむダヌは、自瀟のビッグデヌタを第䞉者に提䟛するこずで収益化したす。 BigData オペレヌタヌの䞻な顧客は商業銀行です。 デヌタベヌスを䜿甚しお、カヌドがリンクされおいる加入者の SIM カヌドの䞍審なアクティビティを監芖し、リスク スコアリング、怜蚌、監芖サヌビスを利甚したす。 そしお 2017 幎、モスクワ政府は技術むンフラず亀通むンフラを蚈画するために Tele2 の BigData デヌタに基づく移動ダむナミクスを芁求したした。
  4. ビッグデヌタ分析はマヌケティング担圓者にずっお宝の山であり、垌望に応じお数千もの加入者グルヌプに向けおパヌ゜ナラむズされた広告キャンペヌンを䜜成できたす。 通信䌚瀟は、加入者の゜ヌシャル プロファむル、消費者の関心、行動パタヌンを集玄し、収集したビッグデヌタを䜿甚しお新しい顧客を匕き぀けたす。 しかし、倧芏暡なプロモヌションや PR 蚈画の堎合、請求曞には必ずしも十分な機胜があるずは限りたせん。プログラムでは、クラむアントに関する詳现情報ず䞊行しお倚くの芁玠を同時に考慮する必芁がありたす。

いただにビッグデヌタを空虚な蚀葉だず考える人もいるが、四倧䌁業はすでにビッグデヌタで収益を䞊げおいる。 MTS はビッグデヌタ凊理から 14 か月で 2 億ルヌブルを皌ぎ出し、TeleXNUMX はプロゞェクトからの収益を XNUMX 倍に増加させたした。 ビッグデヌタはトレンドから必須ぞず倉わり぀぀あり、それに基づいお通信事業者の構造党䜓が再構築されるこずになりたす。

出所 habr.com

コメントを远加したす