صورت‌حساب کلان داده: درباره BigData در مخابرات

در سال 2008، BigData یک اصطلاح جدید و روند مد بود. در سال 2019، BigData یک هدف فروش، منبع سود و دلیلی برای قبوض جدید است.

پاییز گذشته، دولت روسیه لایحه ای را برای تنظیم کلان داده ها ارائه کرد. ممکن است افراد از روی اطلاعات شناسایی نشوند، اما ممکن است بنا به درخواست مقامات فدرال این کار را انجام دهند. پردازش BigData برای اشخاص ثالث فقط پس از اطلاع Roskomnadzor است. شرکت هایی که بیش از 100 هزار آدرس شبکه دارند مشمول قانون می شوند. و البته، جایی که بدون رجیستر - قرار است یکی با لیستی از اپراتورهای پایگاه داده ایجاد شود. و اگر قبلاً این Big Data توسط همه جدی گرفته نمی شد ، اکنون باید در نظر گرفته شود.

من به عنوان مدیر یک شرکت توسعه دهنده صورتحساب که این داده های بزرگ را پردازش می کند، نمی توانم پایگاه داده را نادیده بگیرم. من به داده های بزرگ از طریق منشور اپراتورهای مخابراتی فکر خواهم کرد، که از سیستم های صورتحساب آنها هر روز جریان اطلاعات در مورد هزاران مشترک عبور می کند.

قضیه

بیایید مانند یک مسئله ریاضی شروع کنیم: ابتدا ثابت می کنیم که داده های اپراتورهای مخابراتی را می توان BigDat نامید. به طور معمول، داده های بزرگ با سه ویژگی VVV مشخص می شوند، اگرچه در تفسیرهای آزاد تعداد "Vs" به هفت رسید.

جلد. MVNO Rostelecom به تنهایی به بیش از یک میلیون مشترک خدمات ارائه می دهد. اپراتورهای میزبان کلیدی داده های 44 تا 78 میلیون نفر را مدیریت می کنند. ترافیک هر ثانیه در حال افزایش است: در سه ماهه اول سال 2019، مشترکان قبلاً به 3,3 میلیارد گیگابایت از تلفن های همراه دسترسی داشته اند.

سرعت. هیچ کس نمی تواند بهتر از آمار در مورد پویایی به شما بگوید، بنابراین من پیش بینی های سیسکو را بررسی می کنم. تا سال 2021، 20 درصد از ترافیک IP به ترافیک تلفن همراه خواهد رفت - این میزان در عرض پنج سال تقریباً سه برابر خواهد شد. یک سوم اتصالات تلفن همراه M2M خواهد بود - توسعه اینترنت اشیا منجر به افزایش شش برابری در اتصالات خواهد شد. اینترنت اشیا نه تنها سودآور، بلکه منابع فشرده نیز خواهد شد، بنابراین برخی از اپراتورها فقط بر روی آن تمرکز خواهند کرد. و کسانی که اینترنت اشیا را به عنوان یک سرویس جداگانه توسعه دهند، ترافیک مضاعف دریافت خواهند کرد.

تنوع. تنوع یک مفهوم ذهنی است، اما اپراتورهای مخابراتی تقریباً همه چیز را در مورد مشترکین خود می دانند. از مشخصات نام و گذرنامه گرفته تا مدل تلفن، خریدها، مکان های بازدید شده و علایق. طبق قانون Yarovaya، فایل های رسانه ای به مدت شش ماه ذخیره می شوند. بنابراین بیایید آن را به عنوان یک اصل بدیهی در نظر بگیریم که داده های جمع آوری شده متنوع هستند.

نرم افزار و روش

ارائه دهندگان یکی از مصرف کنندگان اصلی BigData هستند، بنابراین بیشتر تکنیک های تجزیه و تحلیل داده های بزرگ در صنعت مخابرات قابل اجرا هستند. سوال دیگر این است که چه کسی آماده سرمایه گذاری در توسعه ML، AI، Deep Learning، سرمایه گذاری در مراکز داده و داده کاوی است. کار تمام عیار با پایگاه داده شامل زیرساخت ها و یک تیم است که هزینه های آن را همه نمی توانند بپردازند. شرکت‌هایی که قبلاً یک انبار شرکتی دارند یا در حال توسعه روش‌های حاکمیت داده هستند، باید روی BigData شرط بندی کنند. برای کسانی که هنوز برای سرمایه گذاری بلندمدت آماده نیستند، به شما توصیه می کنم که معماری نرم افزار را به تدریج ایجاد کرده و اجزای سازنده را یکی یکی نصب کنید. می توانید ماژول های سنگین و Hadoop را برای آخر بگذارید. تعداد کمی از مردم راه حل آماده ای را برای مشکلاتی مانند کیفیت داده و داده کاوی خریداری می کنند؛ شرکت ها به طور کلی سیستم را بر اساس مشخصات و نیازهای خاص خود سفارشی می کنند - خودشان یا با کمک توسعه دهندگان.

اما هر صورتحساب را نمی توان برای کار با BigData تغییر داد. یا بهتر است بگوییم، نه تنها همه چیز را می توان اصلاح کرد. افراد کمی می توانند این کار را انجام دهند.

سه نشانه که یک سیستم صورتحساب شانس تبدیل شدن به یک ابزار پردازش پایگاه داده را دارد:

  • مقیاس پذیری افقی نرم افزار باید انعطاف پذیر باشد - ما در مورد داده های بزرگ صحبت می کنیم. افزایش در مقدار اطلاعات باید با افزایش متناسب در سخت افزار در خوشه درمان شود.
  • تحمل خطا. سیستم‌های پیش‌پرداخت جدی معمولاً به‌طور پیش‌فرض تحمل خطا دارند: صورت‌حساب به‌صورت خوشه‌ای در چندین موقعیت جغرافیایی مستقر می‌شود تا به‌طور خودکار یکدیگر را بیمه کنند. همچنین باید کامپیوترهای کافی در کلاستر Hadoop وجود داشته باشد تا یک یا چند مورد از کار بیفتند.
  • محل. داده ها باید در یک سرور ذخیره و پردازش شوند، در غیر این صورت می توانید در انتقال داده ها خراب شوید. یکی از روش‌های محبوب Map-Reduce: فروشگاه‌های HDFS، فرآیندهای Spark. در حالت ایده آل، نرم افزار باید به طور یکپارچه در زیرساخت مرکز داده ادغام شود و بتواند سه کار را به صورت یکجا انجام دهد: جمع آوری، سازماندهی و تجزیه و تحلیل اطلاعات.

تیم

اینکه این برنامه چه، چگونه و برای چه هدفی کلان داده را پردازش کند، توسط تیم تصمیم می گیرد. اغلب شامل یک نفر - یک دانشمند داده است. اگرچه به نظر من حداقل بسته کارمندان برای Big Data شامل مدیر محصول، مهندس داده و مدیر نیز می شود. اولین نفر خدمات را درک می کند، زبان فنی را به زبان انسانی ترجمه می کند و بالعکس. مهندس داده مدل‌ها را با استفاده از جاوا/اسکالا و آزمایش‌هایی با یادگیری ماشین زنده می‌کند. مدیر مراحل را هماهنگ می کند، اهداف تعیین می کند و کنترل می کند.

مشکلات

از طرف تیم BigData است که معمولاً هنگام جمع آوری و پردازش داده ها مشکلاتی ایجاد می شود. برنامه باید توضیح دهد که چه چیزی را جمع آوری کند و چگونه آن را پردازش کند - برای توضیح این موضوع، ابتدا باید خودتان آن را درک کنید. اما برای ارائه دهندگان، همه چیز به این سادگی نیست. من در مورد مشکلات با استفاده از مثال وظیفه کاهش ریزش مشترک صحبت می کنم - این همان چیزی است که اپراتورهای مخابراتی در وهله اول با کمک Big Data سعی در حل آن دارند.

تعیین اهداف. مشخصات فنی به خوبی نوشته شده و درک متفاوت از اصطلاحات درد صدها ساله نه تنها برای فریلنسرها بوده است. حتی مشترکین "افتاده" را می توان به روش های مختلف تفسیر کرد - به عنوان کسانی که به مدت یک ماه، شش ماه یا یک سال از خدمات اپراتور استفاده نکرده اند. و برای ایجاد یک MVP بر اساس داده‌های تاریخی، باید فراوانی بازگشت مشترکین از Churn را درک کنید - کسانی که اپراتورهای دیگر را امتحان کردند یا شهر را ترک کردند و از شماره دیگری استفاده کردند. سوال مهم دیگر: چه مدت قبل از خروج مشترک، باید ارائه دهنده این موضوع را تعیین کند و اقدام کند؟ شش ماه خیلی زود است، یک هفته خیلی دیر.

جایگزینی مفاهیم به طور معمول، اپراتورها یک مشتری را با شماره تلفن شناسایی می کنند، بنابراین منطقی است که علائم باید با استفاده از آن آپلود شوند. حساب شخصی یا شماره درخواست خدمات شما چطور؟ باید تصمیم گرفت که کدام واحد به عنوان مشتری گرفته شود تا داده های سیستم اپراتور تغییر نکند. ارزیابی ارزش مشتری نیز مشکوک است - کدام مشترک برای شرکت ارزشمندتر است، کدام کاربر برای حفظ آن به تلاش بیشتری نیاز دارد، و کدام یک در هر صورت "از بین خواهند رفت" و هیچ فایده ای برای صرف منابع برای آنها وجود ندارد.

فقدان اطلاعات. همه کارمندان ارائه‌دهنده نمی‌توانند به تیم BigData توضیح دهند که به طور خاص بر ریزش مشترکین تأثیر می‌گذارد و عوامل ممکن در صورت‌حساب چگونه محاسبه می‌شوند. حتی اگر یکی از آنها را نامگذاری کنند - ARPU - معلوم می شود که می توان آن را به روش های مختلف محاسبه کرد: یا با پرداخت های دوره ای مشتری یا با هزینه های صورتحساب خودکار. و در روند کار، یک میلیون سوال دیگر مطرح می شود. آیا این مدل همه مشتریان را پوشش می‌دهد، قیمت حفظ مشتری چقدر است، آیا فکر کردن به مدل‌های جایگزین فایده‌ای دارد و با مشتریانی که به اشتباه به‌طور مصنوعی حفظ شده‌اند، چه باید کرد.

تعیین هدف. من سه نوع خطای نتیجه را می شناسم که باعث می شود اپراتورها از پایگاه داده ناامید شوند.

  1. ارائه‌دهنده روی BigData سرمایه‌گذاری می‌کند، گیگابایت اطلاعات را پردازش می‌کند، اما به نتیجه‌ای می‌رسد که می‌توانست ارزان‌تر به دست آورد. از نمودارها و مدل های ساده، تحلیل های اولیه استفاده می شود. هزینه چندین برابر بیشتر است، اما نتیجه یکسان است.
  2. اپراتور داده های چند وجهی را به عنوان خروجی دریافت می کند، اما نحوه استفاده از آن را نمی داند. تجزیه و تحلیل وجود دارد - در اینجا قابل درک و حجیم است، اما فایده ای ندارد. نتیجه نهایی، که نمی‌تواند شامل هدف «پردازش داده‌ها» باشد، هنوز فکر نشده است. پردازش کافی نیست - تجزیه و تحلیل باید مبنایی برای به روز رسانی فرآیندهای تجاری شود.
  3. موانع استفاده از تجزیه و تحلیل BigData می تواند فرآیندهای تجاری قدیمی و نرم افزارهای نامناسب برای اهداف جدید باشد. این بدان معنی است که آنها در مرحله آماده سازی اشتباه کردند - آنها از طریق الگوریتم اقدامات و مراحل معرفی Big Data به کار فکر نکردند.

برای چه؟

صحبت از نتایج. من روش‌های استفاده و کسب درآمد از داده‌های بزرگ را که اپراتورهای مخابراتی از قبل استفاده می‌کنند، مرور خواهم کرد.
ارائه دهندگان نه تنها خروجی مشترکان، بلکه بار روی ایستگاه های پایه را نیز پیش بینی می کنند.

  1. اطلاعات در مورد حرکات مشترک، فعالیت و خدمات فرکانس تجزیه و تحلیل می شود. نتیجه: کاهش تعداد اضافه بارها به دلیل بهینه سازی و نوسازی مناطق مشکل دار زیرساخت.
  2. اپراتورهای مخابراتی هنگام باز کردن نقاط فروش از اطلاعات مربوط به موقعیت جغرافیایی مشترکین و تراکم ترافیک استفاده می کنند. بنابراین، تجزیه و تحلیل BigData قبلاً توسط MTS و VimpelCom برای برنامه ریزی مکان دفاتر جدید استفاده می شود.
  3. ارائه دهندگان داده های بزرگ خود را با ارائه آن به اشخاص ثالث کسب درآمد می کنند. مشتریان اصلی اپراتورهای BigData بانک های تجاری هستند. آنها با استفاده از پایگاه داده، فعالیت‌های مشکوک سیم کارت مشترک را که کارت‌ها به آن مرتبط هستند، رصد می‌کنند و از خدمات امتیازدهی، تأیید و نظارت ریسک استفاده می‌کنند. و در سال 2017، دولت مسکو برای برنامه ریزی زیرساخت های فنی و حمل و نقل، پویایی حرکت را بر اساس داده های BigData از Tele2 درخواست کرد.
  4. تجزیه و تحلیل BigData یک معدن طلا برای بازاریابان است که در صورت تمایل می توانند کمپین های تبلیغاتی شخصی سازی شده برای هزاران گروه مشترک ایجاد کنند. شرکت های مخابراتی پروفایل های اجتماعی، علایق مصرف کننده و الگوهای رفتاری مشترکین را جمع آوری می کنند و سپس از BigData جمع آوری شده برای جذب مشتریان جدید استفاده می کنند. اما برای برنامه ریزی تبلیغات و روابط عمومی در مقیاس بزرگ، صورتحساب همیشه عملکرد کافی ندارد: این برنامه باید به طور همزمان عوامل زیادی را به موازات اطلاعات دقیق در مورد مشتریان در نظر بگیرد.

در حالی که برخی هنوز BigData را یک عبارت خالی می دانند، چهار بزرگ در حال حاضر از آن درآمد کسب می کنند. MTS 14 میلیارد روبل از پردازش کلان داده در شش ماه درآمد کسب می کند و Tele2 درآمد حاصل از پروژه ها را سه و نیم برابر افزایش داد. BigData در حال تبدیل شدن از یک روند به یک امر ضروری است که بر اساس آن کل ساختار اپراتورهای مخابراتی بازسازی خواهد شد.

منبع: www.habr.com

اضافه کردن نظر