در ۱۴ مارس ۲۰۱۷، آرتور خاچویان، مدیر عامل Social Data Hub، در سخنرانی BBDO صحبت کرد. آرتور در مورد نظارت هوشمند، ساخت مدلهای رفتاری، تشخیص محتوای عکس و ویدیو، و همچنین سایر ابزارها و تحقیقات Social Data Hub که به شما امکان میدهد با استفاده از شبکههای اجتماعی و فناوریهای Big Data، مخاطبان را هدف قرار دهید، صحبت کرد.
آرتور خاچویان (از این پس - ق): - سلام! سلام به همه! نام من آرتور خاچویان است، من شرکت Social Data Hub را اداره می کنم، و ما درگیر تحلیل های فکری جالب مختلفی از منابع داده باز، زمینه های اطلاعاتی و انواع تحقیقات جالب و غیره هستیم.
و امروز همکاران گروه BBDO از ما خواستند در مورد فن آوری های مدرن برای تجزیه و تحلیل داده های بزرگ، داده های بزرگ و نه چندان بزرگ برای تبلیغات صحبت کنیم: نحوه استفاده از آن، چند نمونه جالب را نشان دهید. امیدوارم در طول راه سوال بپرسید، زیرا می توانم خسته شوم و ماهیت و غیره را فاش نکنم، پس خجالتی نباشید.
در واقع، جهتهای اصلی، جایی که تا به حال از نوعی راهحلهای "تقریباً کلان داده" استفاده شده است، همه آنها واضح هستند - این هدف گیری مخاطب، تجزیه و تحلیل، انجام نوعی تحقیقات بازاریابی تحلیلی است. اما همیشه جالب است که چه داده های اضافی را می توان یافت، چه معانی اضافی را می توان پس از اعمال تجزیه و تحلیل یافت.
چرا برای تبلیغات به فناوری نیاز داریم؟
از کجا شروع کنیم؟ واضح ترین چیز تبلیغات در شبکه های اجتماعی است. امروز صبح آن را برداشتم: بنا به دلایلی VKontakte فکر می کند باید این تبلیغ خاص را ببینم ... خوب یا بد، سوال دوم است. می بینیم که من قطعاً در رده سربازان وظیفه قرار می گیرم:
اولین و جالب ترین چیزی که می توان آن را به عنوان یک راه حل تکنولوژیک در نظر گرفت... اولین چیزی که می خواستم قبل از شروع تصمیم بگیرم این است که اصطلاحات را تعریف کنیم: داده های باز چیست و داده های بزرگ چیست؟ زیرا همه مردم درک خود را در این مورد دارند و من نمی خواهم شرایط خود را به کسی تحمیل کنم، اما... فقط برای اینکه اختلافی وجود نداشته باشد.
شخصاً فکر میکنم دادههای باز تنها چیزی است که میتوانم بدون ورود یا رمز عبور به آن دسترسی پیدا کنم. این یک نمایه باز در شبکههای اجتماعی است، این نتایج جستجو است، اینها ثبتهای باز هستند، و غیره. دادههای بزرگ، در درک خودم، آن را اینگونه میبینم: اگر یک صفحه داده باشد، یک میلیارد ردیف است، اگر نوعی باشد. از ذخیره سازی فایل، یک پتابایت داده است. بقیه در اصطلاح من کلان داده نیست، بلکه چیزی شبیه به آن است.
پروفایل با دقت بالا و امتیازدهی پروفایل
به ترتیب بریم اولین و جالب ترین چیزی که می توانید از تجزیه و تحلیل منابع داده باز به دست آورید، نمایه سازی با دقت بالا و امتیازدهی پروفایل است. این چیه؟ این داستانی است که در آن حساب شبکه اجتماعی شما نه تنها می تواند شما را پیش بینی کند، نه تنها علایق شما را.
اما اکنون، با ترکیب منابع مختلف، می توانید میانگین سطح حقوق، هزینه آپارتمان شما و محل قرارگیری آن را درک کنید. و همه این داده ها را می توان به معنای واقعی کلمه از وسایل موجود استفاده کرد. به عنوان مثال، اگر حساب خود را در یک شبکه اجتماعی میگیرید، ببینید، مثلاً کجا زندگی میکنید، کجا کار میکنید. درک کنید که شرکتی که در آن کار می کنید در کدام بخش از تجارت است. اگر یک تحلیلگر، مدیر و غیره هستید، موقعیت های خالی مشابه را از HH و "Superjob" بارگیری کنید. به محل زندگی خود نگاه کنید (مثلاً CIAN)، درک کنید که اجاره خانه در این مکان چقدر هزینه دارد، هزینه خرید خانه در این مکان چقدر است، تقریباً میزان درآمدتان را پیش بینی کنید. علاوه بر این، با استفاده از شبکه های اجتماعی خود، می توانید بفهمید که چقدر سفر می کنید، کجا هستید و چقدر به کارفرمای خود وفادار هستید.
بر این اساس، از چنین تعداد زیادی معیار می توانیم هر کاری را که بخواهیم انجام دهیم. ما می توانیم محصولی را به شما معرفی کنیم که مورد علاقه شماست. آیا می توانید یک فروشگاه اینترنتی را تصور کنید؟ شما به آنجا می روی - این فروشگاه آنلاین حساب شما را در یک شبکه اجتماعی می گیرد و به شما می گوید: "ماشا، به تازگی از دوست پسرت جدا شدی، در اینجا برخی از محصولات خاص برای شما وجود دارد." این آینده نزدیک نیست...
موقعیت جغرافیایی افراد چگونه تعیین می شود؟
پاسخ به سوالات حضار:
- به طور معمول، 80٪ از تمام چک-این ها به عنوان محل دقیق اقامت در نظر گرفته می شود. اما برای افرادی که هیچ جا را چک نمی کنند، چندین گزینه وجود دارد: یا ورود، یا موقعیت جغرافیایی، یا این تجزیه و تحلیل پست ها و انتشارات برای کل مدت زمانی است که شخصی چیزی نوشته است... و در جایی، چیزی مانند «میخواهم یک کالسکه در نزدیکی آکادمیچسکایا بخرم» یا «من اخیراً گرافیتیهای زشتی را روی دیوار اینجا دیدم» ظاهر میشود. یعنی تقریباً برای 80 درصد افراد، موقعیت جغرافیایی، محل کار و محل زندگی آنها را می توان با استفاده از داده ها یا ابرداده های قابل جمع آوری از شبکه های اجتماعی تعیین کرد.
این دوباره تحلیلی از پست هاست. به سادهترین معنا، این تحلیلی از بررسیها و موقعیتهای جغرافیایی در شبکههای اجتماعی است که ابردادههای jpeg را حذف نمیکند (شما میتوانید چیزی از آن بفهمید). اما برای افراد باقیمانده، اینها معمولاً پخش متنی هستند: یا زمانی که شخصی در مورد چیزی می نویسد، موقعیت مکانی خود را "درخشش" می کند، یا تلفن خود را "تابش" می دهد، که به وسیله آن می توانید برخی از تبلیغات او را در Avito یا حساب کاربری او در " پیدا کنید. Auto RU". بر اساس این داده ها، می توانید ترکیب کنید (به عنوان مثال، "من یک ماشین را در نزدیکی Mayakovskaya می فروشم") و تقریباً این را فرض کنید.
- مردم معمولا این را در شبکه های اجتماعی منتشر می کنند. ما فقط با منابع باز کار می کنیم و در اینجا به طور انحصاری در مورد منابع باز صحبت می کنیم. آنها معمولاً آگهیهایی را منتشر میکنند، یعنی در شصت درصد موارد، رایجترین داستانی که مردم شماره تلفن همراه فعلی خود را «نشان میدهند»، تبلیغات برای فروش چیزی است. یا در بعضی از گروه ها یک نفر می نویسد («این یا آن را آنجا می فروشم»)، یا به جایی می رود.
آره! آنها معمولاً اینگونه اظهار نظر می کنند: «جواب بده یا اس ام اس بده، با شماره من تماس بگیر. این اغلب برای افرادی اتفاق می افتد که چیزی را می فروشند، چیزی را در شبکه های اجتماعی می خرند، با کسی ارتباط برقرار می کنند ... بر این اساس، با استفاده از این شماره می توانید پروفایل او را در CIAN به آن پیوند دهید، اگر او تا به حال چیزی منتشر کرده است، یا، دوباره، در آویتو. اینها به سادگی محبوب ترین و برترین منابع هستند، اینها در ادامه خواهد آمد - اینها Avito، CIAN و غیره هستند.
- این به یک فروشگاه آنلاین اشاره دارد. بعدی فناوری تشخیص چهره و تطبیق پروفایل خواهد بود (ما در مورد آن صحبت خواهیم کرد). صرفاً از نظر تئوری، این را می توان برای یک فروشگاه آفلاین اعمال کرد. و به طور کلی، رویای بزرگ من این است که وقتی بنرهای خیابانی ظاهر می شوند، وقتی از کنار دوربین رد می شوید، صورت شما را "به دام" می اندازد. اما این مورد از نظر قانونی ممنوع خواهد بود زیرا نقض حریم خصوصی است. امیدوارم دیر یا زود این اتفاق بیفتد.
- از تجربه شخصی. خیلی وقتها وقتی شخصی چیزی برای شما مینویسد، شما بر روی برخی از حقایق زندگی او عمل میکنید که به نظر میرسد نباید بدانید... مردم در بیشتر موارد میترسند. ولی! بر اساس آمارهای اخیر تعداد حساب های بسته در شبکه های اجتماعی 14 درصد کاهش یافته است. تعداد جعلی ها در حال افزایش است، تعداد حساب های باز در حال افزایش است - مردم به طور فزاینده ای به سمت باز شدن حرکت می کنند. من فکر می کنم که در عرض 3-4 سال آنها واکنش شدیدی نسبت به این واقعیت که کسی اطلاعاتی در مورد آنها می داند که به طور بالقوه نباید بدانند را متوقف خواهند کرد. اما در واقع با نگاه کردن به دیوار او بسیار آسان است.
چه چیزی را می توان از منابع باز گرفت؟
فهرست تقریبی از چیزهایی وجود دارد که می توان آنها را با قابلیت اطمینان نسبتاً بالا از منابع باز فهمید. در واقع، معیارهای متفاوت تری نیز وجود دارد. بستگی به مشتری چنین تحقیقاتی دارد. یک آژانس منابع انسانی وجود دارد که به این موضوع علاقه دارد که آیا در شبکه های اجتماعی فحش می دهید یا جایی در فضای عمومی. کسی علاقه مند است که آیا نشریات ناوالنی را دوست دارید یا، برعکس، نشریات روسیه متحد، یا نوعی محتوای مستهجن را دوست دارید - چنین چیزهایی اغلب اتفاق می افتد.
مهمترین آنها ارزش های خانوادگی، هزینه تقریبی یک آپارتمان، خانه، جستجوی ماشین و غیره است. بر این اساس می توان افراد را به گروه های اجتماعی تقسیم کرد. اینها کاربران Moscow Tinder هستند که هستند (طبق تصاویر آنها که در حساب های فیس بوک آنها یافت می شود). آنها بر اساس علایق خود به گروه های مختلف اجتماعی تقسیم می شوند:
اگر به تبلیغات نزدیکتر شویم، وقتی در VKontakte انتخاب میکنید که به مردان 18 ساله مشترک در گروههای خاصی علاقه دارید، به آرامی از هدفگذاری تبلیغات استاندارد فاصله گرفتهایم. من این عکس بعدی را دارم، اکنون به شما نشان خواهم داد:
نکته اصلی این است که اکثر سرویسهای فعلی که اصولاً افرادی را که شبکههای اجتماعی را تحلیل میکنند، تجزیه و تحلیل میکنند، درگیر تجزیه و تحلیل علایق هستند... اولین چیزی که به ذهن مردم میرسد این است که گروههای برتر مشترکین خود را تجزیه و تحلیل کنند. شاید این برای برخی کارساز باشد، اما شخصاً فکر می کنم اساساً اشتباه است. چرا؟
لایک های شما جمع آوری و تجزیه و تحلیل می شوند
اکنون تلفن های خود را بردارید، به گروه های برتر خود نگاه کنید - قطعاً بیش از 50٪ از گروه هایی وجود خواهند داشت که قبلاً آنها را فراموش کرده اید، این نوعی محتوای است که در واقع برای شما بی ربط است. شما اصلاً آن را مصرف نمیکنید، اما با این وجود سیستم شما را بر اساس آنها ردیابی میکند: اینکه در دستور العملها، در برخی از گروههای محبوب مشترک شدهاید. یعنی سیستمی را که پروفایل شما را تجزیه و تحلیل می کند نقض می کنید و منافع شما توجیه نمی شود.
در حال حرکت ... چه چیزی وجود دارد؟ ما فرض می کنیم که دیگران چه می کنند. به نظر ما، مناسب ترین راه برای ارزیابی علایق کاربران، لایک است. به عنوان مثال، در VKontakte هیچ فید لایک وجود ندارد و مردم فکر می کنند که هیچ کس نمی داند چه چیزی را دوست دارد. بله، برخی از لایک ها در اینستاگرام معرفی می شوند، ما چیزی را در فیس بوک می بینیم، اما بیشتر مطالب در گروه های خاص این را در یک فید مشترک پخش نمی کنند و مردم زندگی می کنند و فکر می کنند که هیچ کس نمی داند چه چیزی را دوست دارد.
و با جمع آوری محتوای خاصی از نوعی که مورد علاقه ماست، جمع آوری این پست ها، جمع آوری این لایک ها، سپس بررسی این شخص با استفاده از این پایگاه داده، می توانیم با دقت بالا مشخص کنیم که او کیست، سرنوشت او چیست، به چه چیزی علاقه دارد. او را دقیقاً در یک گروه اجتماعی خاص قرار دهید و با او تعامل کنید.
خرید خودرو رفتار را تغییر می دهد
من چنین مثالی دارم. من بلافاصله رزرو می کنم که نمونه های من تقریباً تبلیغاتی و نزدیک به بازاریابی هستند، زیرا، می دانید، اکثر موارد توسط NDA و غیره محافظت می شوند. اما هنوز چیزهای جالب زیادی وجود خواهد داشت. بنابراین، داستان با این افراد: اینها مردانی هستند که بین سال های 2010 تا 2015 یک ماشین خریدند. نحوه تغییر رفتار اجتماعی آنلاین آنها با رنگ نشان داده می شود. درصد دختران در میان مشترکین تغییر کرده است، من در صفحات عمومی "پسرانه" مشترک شدم، یک شریک جنسی دائمی پیدا کردم ...
کل این موضوع بر اساس برند خودرو و تعداد افراد تجزیه شده است. از اینجا میتوانید نتایج جالب زیادی در مورد رفتار افراد و نحوه کارکرد آنها بگیرید. می توانم بگویم که پورشه کاین و پریورای کاشته شده از نظر تعداد مخاطبان تقریباً یکسان هستند. کیفیت این مخاطب و رفتارشان متفاوت است، اما کمیت آن تقریباً یکسان است. نتیجه ای که می توانید از اینجا بگیرید این است که هر چیزی که می خواهید، نزدیکتر به بازار شماست. اگر آئودی بفروشید، شعار «آئودی بخر و از پدر و مادرت دور شو» را می سازید. و غیره
بله، این یک مثال خنده دار از این واقعیت است که رفتار افراد بر اساس تجزیه و تحلیل لایک ها، بر اساس اینکه به کدام گروه منتقل می شوند، چه محتوایی را تجزیه و تحلیل می کنند - با احتمال تقریباً 100٪ مشخص می کند که شما کی هستید. زیرا اگر به ترافیک شبکه دسترسی نداشته باشید و پیامهای شخصی را نخوانید، لایکها همیشه به شما میگویند که این شخص کیست - یک زن باردار، یک مادر، یک مرد نظامی، یک پلیس. و برای شما، به عنوان فردی که می توانید تبلیغ کنید، این یک ضربه بزرگ به هدف است.
پاسخ به سوالات حضار:
- هر ستون تعداد افراد این ماشین است. چگونه الگوهای رفتاری آنها تغییر کرده است. نگاه کنید: افرادی که یک پورشه کاین خریدند - تقریباً 550 نفر (زرد)، درصد دختران در میان مشترکان افزایش یافته است.
- نمونه، کاربران شبکه های اجتماعی "Vkontakte"، "Facebook"، "Instagram" از سال 2010 تا 2015 هستند. تنها توضیح: خودروهای انتخاب شده در اینجا آنهایی هستند که با استفاده از ابزارهای خاص در عکس ها با دقت بیش از 80 درصد قابل شناسایی هستند.
- در یک بازه زمانی مشخص، ماشین او (خب، نه مال او، آن را به شبکه های اجتماعی می سپاریم)... در یک بازه زمانی مشخص، یک نفر مدام با ماشین عکس می گرفت، با آن بود، نشریات متفاوت بودند، عکس ها از زوایای مختلف بودند و غیره. سپس یک عکس از این که چه افرادی با چه ماشین هایی در حال عکس گرفتن هستند و... بله، این سوال دوم است - اعتماد به داده های شبکه های اجتماعی.
- از آنجایی که ما آن را مطرح کردیم، متاسفانه داده های رسانه های اجتماعی همیشه صحیح نیستند. مردم همیشه تمایلی به انتشار اطلاعات خود ندارند. من شخصاً چنین مطالعه ای انجام دادم: تعداد فارغ التحصیلان دانشگاه های مسکو را با تعداد افرادی که در شبکه های اجتماعی ثبت نام کرده اند مقایسه کردم. به طور متوسط، 60٪ افراد بیشتری در شبکه های اجتماعی ثبت نام می کنند - فارغ التحصیلان دانشگاه دولتی مسکو در یک سال خاص در تخصص های خاص - از آنچه در اصل وجود دارد. بنابراین بله - طبیعتاً درصدی از خطاها در اینجا وجود دارد و هیچ کس آن را پنهان نمی کند. در اینجا ما به سادگی آن دسته از خودروهایی را که با احتمال بیش از 80٪ قابل شناسایی هستند، به عنوان پایه در نظر می گیریم.
فهرست منابع برای آموزش مدل
در اینجا یک لیست نمونه از منابعی است که می توان از آنها استفاده کرد، که برای تعیین مشخصات اجتماعی یک فرد با اطمینان بسیار استفاده می شود.
ما یک نمایه از شبکه های اجتماعی، از CIAN می گیریم - هزینه یک آپارتمان تقریباً "Head-Hunter"، "Superjob" است - این میانگین حقوق برای یک فرد معین است. امیدوارم هیچ نماینده ای از Head Hunter در اینجا نباشد، زیرا آنها فکر می کنند گرفتن این داده ها از آنها خیلی خوب نیست. با این حال، این میانگین حقوق در مناطق خاصی برای انواع خاصی از فعالیت ها برای مشاغل خالی است.
"Avito"، "Avto.ru": اغلب مردم، هنگامی که تلفن آنها روشن می شود، قطعا آن را (در تعداد زیادی از موارد) حداقل چیزی در "Avito"، یا در "Avto.ru"، یا در چندین سایت دیگر که از آنها می توانید بفهمید که آنها چه کسانی هستند. اگر کالسکه یا ماشینی در این شماره تلفن فروخته شده باشد... Rosstat و ثبت احوال واحد حقوقی هنوز ثبت های بیشتری هستند که با کمک آنها می توانید شرکت استخدام کننده را رتبه بندی کنید - طبق برخی فرمول ها، طبق مدلی که هر شخصی می تواند تنظیم کند (شما می توانید تقریباً پول این شخص را تعیین کنید و غیره).
Tinder به جمع آوری داده ها در مورد وضعیت افراد کمک می کند
به علاوه، یک چیز جالب وجود دارد (به طور متناوب، در مطالعه بسیار خنده دار است) - این دوباره مجموعه داده های Moscow Tinder با استفاده از ربات ها برای این Tinder است. فاصله تا افراد مشخص شد و سپس مکان تقریبی آنها مشخص شد.
هدف از این مطالعه تعیین تعداد حساب های Tinder در قلمرو نهادهای دولتی - در دوما، دفتر دادستان و غیره بود. اما شما به عنوان یک تبلیغکننده، میتوانید هر چیزی را که میخواهید تصور کنید: مثلاً استارباکس یا شخص دیگری... یعنی تعداد افرادی که در Tinder از شما قهوه مینوشند، چیزی سفارش میدهند، در فروشگاهها هستند. در مورد این موقعیت جغرافیایی: با هر سرویسی می توان این کار را انجام داد.
پاسخ به سوال حضار:
- تایندر؟ تو نمی دانی؟ Tinder یک برنامه دوستیابی است که در آن از طریق عکس ها (چپ-راست) نگاه می کنید و این برنامه فاصله تا شخص را به شما نشان می دهد. اگر فاصله این فرد را از سه نقطه مختلف بدست آورید، می توانید تقریباً (+ 5-7 متر) مکان را تعیین کنید. در این مورد، برای تعیین در قلمرو دفتر دادستانی یا دومای ایالتی، آنقدر دشوار نیست. اما دوباره، می تواند فروشگاه شما باشد، می تواند هر چیزی باشد.
به عنوان مثال، خیلی وقت پیش، ما چنین موردی داشتیم (مطالعه ای نیست)، زمانی که از یکی از اپراتورهای سلولی داده هایی در مورد تراکم ترافیک، داده هایی در مورد تراکم حرکت نقاط سلولی دریافت کردیم و همه این اطلاعات روی هم قرار گرفتند. در مختصات بیلبوردهای واقع در بزرگراه ها . و وظیفه اپراتور تلفن همراه این است که به طور تقریبی تعیین کند که چه تعداد از مردم در حال عبور هستند و به طور بالقوه می توانند این تبلیغات بیلبورد را ببینند.
اگر متخصصان تبلیغات بیلبورد در اینجا هستند، می توانید بگویید: درک با قابلیت اطمینان فوق العاده غیرممکن است - کسی می آید، کسی نگاه نمی کند، کسی نگاه می کند ... با این وجود، این نمونه ای از وجود 20 میلیارد چند ضلعی است. اینها در مسکو که تراکم این افراد در هر ساعت در مسیرهای خاص روی آن است... شما می توانید ببینید که این افراد هر لحظه از چه چیزی عبور می کردند و جریان مسافر را تقریباً تخمین می زنید.
پاسخ به سوال حضار:
- هیچ کس چنین داده ای نمی دهد. ما چنین مطالعه ای را برای یکی از اپراتورها انجام دادیم؛ این یک داستان منحصراً داخلی است، بنابراین، متأسفانه، به صورت تصویری ارائه نشده است. اما اغلب آژانس های تبلیغاتی بزرگ برای تماس با اپراتور مشکلی ندارند. حداقل در مسکو، سوابق زیادی وجود دارد که، برای مثال، شرکتهای بیمه به شرکتهایی مانند GetTaxi مراجعه میکنند، که اطلاعات غیرشخصی در مورد سن راننده، نحوه رانندگی آنها (خوب - بد، بیاحتیاط - نه) برای پیشبینی ارائه میکنند. سیاست ها و غیره همه با این مشکل دارند، اما در برخی از سطوح داخلی، دادن داده های ناشناس - فکر می کنم هیچ کس چنین مشکلی ندارد.
تشخیص تصویر و الگو
برو جلو. مورد علاقه من تشخیص تصویر است. یک قطعه کوچک در مورد جستجوی افراد بر اساس چهره وجود خواهد داشت، اما ما عمدتاً این بخش را انجام نمی دهیم. ما به طور خاص تشخیص تصویر و تعیین آنچه در این تصویر وجود دارد - ساخت ماشین، رنگ آن، و غیره را انجام می دهیم.
من این مثال خنده دار را دارم:
چنین مطالعه ای در مورد جستجوی خالکوبی در شبکه های اجتماعی مختلف وجود داشت. بر این اساس، همین امر را می توان برای هر برند، برای هر تصویر بصری، تقریباً برای هر تصویر بصری اعمال کرد. مواردی وجود دارد که نمی توان به طور قابل اعتماد تعیین کرد (ما آنها را نمی گیریم).
این مورد مورد علاقه من است. برندهای خودرو اغلب به این کار روی می آورند زیرا وظیفه آنها، برای مثال، یافتن همه صاحبان برخی از BMW X6، درک اینکه آنها چه کسانی هستند، چگونه به یکدیگر متصل هستند، به چه چیزی علاقه دارند و غیره است. این به این سوال مربوط می شود که مردم با چه ماشین هایی در شبکه های اجتماعی عکس می گیرند.
اینجا اصلاً فیلتری وجود نداشت: شی مال آنها بود، ماشین مال آنها نبود. این فقط خرابی ماشین ها است - سن و غیره. اما تشخیص تصویر بصری اغلب مورد استفاده قرار می گیرد: این جستجو برای زنان باردار است و جستجوی لوگوهای برند در نوعی رسانه جمعی (چه کسی چه چیزی را پست می کند).
مورد مورد علاقه من (که توسط رستوران های مختلف استفاده می شود): چه نوع رول هایی در یک شبکه اجتماعی ارسال می شود. این یک چیز خنده دار است، اما در واقع به شما اجازه می دهد تا چیزهای جالب زیادی را درک کنید، اولاً، در مورد مشتریان خود: چه کسی به شما مراجعه کرده و چرا این کار را انجام داده است. زیرا بر کسی پوشیده نیست که در بارهای سوشی، اکثر مردم (من نمی گویم "دختران") برای بررسی، عکس گرفتن از چیزی و غیره عکس می گیرند.
برند می تواند از این مزیت استفاده کند. این برند علاقه مند است که به چه نوع محصولاتی برای عکاسی و ارسال زیبا نیاز دارد، چه نوع افرادی به آنجا آمدند. این کار را تقریباً با هر چیزی می توان انجام داد، از غذا.
تشخیص الگوی ویدیویی
پاسخ به سوال حضار:
- روی ویدیو نیست ما آن را در حالت تست داریم. ما این فناوری را امتحان کردیم، اما معلوم شد که ... همه چیز را با ویدیو به خوبی تشخیص می دهد، اما ما هیچ جا برنامه ای برای آن پیدا نکردیم. خدا حافظ. جدای از تحلیل اینکه چه مقدار و کدام ویدیو وبلاگ نویسان در جایی صحبت می کنند ... چنین مطالعه ای وجود داشت. چند نفر از چهره های آنها با هم ملاقات می کنند، چند بار. اما برندها هنوز نفهمیدهاند که کجا میتوانند این کار را انجام دهند. شاید روزی بیاید.
باز هم، این غذا است، می تواند زنان باردار، مردان (نه باردار)، اتومبیل - هر چیزی باشد.
به عنوان یک گزینه، مطالعه سال نو برای یک رسانه وجود داشت. همچنین دور از تبلیغات، اما هنوز. این چه غذاهایی است که مردم برای سال نو روزه می گرفتند:
در اینجا نیز بر اساس سن تجزیه می شود. شما می توانید چنین همبستگی را ببینید که جوانان بیشتر غذا سفارش می دهند، بزرگسالان بیشتر یک سفره سنتی درست می کنند. این یک چیز خنده دار است، اما با تصور آن به عنوان یک صاحب برند، می توانید تعداد زیادی از چیزها را ارزیابی کنید: چه کسی محصول شما را مدیریت می کند و چگونه، چه چیزی در مورد آن می نویسد. اغلب، مردم همیشه خود برند را در متن ذکر نمیکنند و سیستمهای نظارت تحلیلی سنتی همیشه نمیتوانند این ذکر نام تجاری را تنها به این دلیل که در متن ذکر نشده است، درک کرده و بیابند. یا متن غلط املایی دارد، تگ هش یا چیز دیگری وجود ندارد.
عکس ها قابل مشاهده است. با عکاسی، می توانید تشخیص دهید که سوژه مرکزی کادر است یا نه، سوژه مرکزی کادر است. سپس می توانید ببینید این شخص چه نوشته است. اما اغلب به عنوان جستجو برای مخاطبان بالقوه ای که اتومبیل های خاصی را رانندگی کرده اند و غیره استفاده می شود. و سپس با این خودروها کارهای جالب زیادی انجام خواهیم داد.
به ربات ها آموزش داده می شود که از انسان ها تقلید کنند
همچنین چنین گزینه ای برای استفاده از شمارش افراد وجود داشت:
گزینه ای برای مقایسه افراد وجود دارد، زمانی که نیاز دارید افرادی را با استفاده از برخی عکس ها پیدا کنید، مشخصات اجتماعی آنها را درک کنید که آنها چه کسانی هستند. باز هم به این سوال برمی گردیم که اگر دوربینی در یک فروشگاه آفلاین داریم، پس این یک راه نسبتاً خوب برای درک اینکه چه کسی به شما مراجعه می کند، این افراد چه کسانی هستند، به چه چیزی علاقه مند هستند، چه چیزی آنها را ترغیب کرد که به شما مراجعه کنند. .
نکته بعدی جالب ترین چیز است: اگر حساب های آنها را در شبکه های اجتماعی جمع آوری کنیم، بفهمیم این افراد چه کسانی هستند، به چه چیزی علاقه دارند، می توانیم (به عنوان یک گزینه) یک ربات شبیه به این افراد بسازیم. این ربات مانند این افراد شروع به زندگی می کند و به تحلیل تبلیغاتی که در شبکه های اجتماعی مختلف می بیند می پردازد. این به شما این امکان را می دهد که به درستی درک کنید که کدام برندها برای این شخص مورد نظر هستند. این نیز یک داستان نسبتاً رایج است، زمانی که شما نه تنها نیاز دارید که این شخص را تجزیه و تحلیل کنید که چه کسی است و چه علایقی دارد، بلکه نیاز دارید که رقبای بالقوه شما یا سایر افراد علاقه مند چه نوع تبلیغاتی را هدف قرار دهند.
تجزیه و تحلیل ارتباطات در شبکه های اجتماعی
نکته جالب بعدی تجزیه و تحلیل روابط بین افراد است. در واقع، تجزیه و تحلیل اتصالات در شبکه، این نمودارهای شبکه - چیز جدیدی در این مورد وجود ندارد، همه این را می دانند.
اما کاربرد برای کارهای تبلیغاتی جالب ترین است. این جستجو برای افرادی است که روندها را تعیین می کنند، این جستجوی افرادی است که اطلاعات را بر اساس معیارهای خاصی در این شبکه منتشر می کنند. بیایید بگوییم که ما به همان صاحبان یک مدل خاص BMW علاقه مند هستیم. با گرد هم آوردن همه آنها می توانیم کسانی را پیدا کنیم که افکار عمومی را کنترل می کنند. اینها لزوماً وبلاگ نویسان خودرو و غیره نیستند. معمولاً اینها رفقای ساده ای هستند که در صفحات عمومی مختلف می نشینند، به مطالبی علاقه مند هستند و می توانند در مدت زمان بسیار کوتاهی، برند شما یا شخص مورد علاقه شما را به این حوزه از مسئولیت جذب کنند. علاقه
در اینجا چنین مثالی وجود دارد. ما افراد بالقوه ای داریم، ارتباطات بین مردم. در اینجا نارنجی ها مردم هستند، نقاط کوچک گروه های مشترک، دوستان مشترک هستند.
اگر تمام این ارتباطات را بین آنها جمع آوری کنید، به وضوح می بینید که افرادی هستند که تعداد زیادی گروه مشترک دارند، دوستان مشترکی دارند، آنها در بین خودشان هستند ... و اگر همین تجسم به گروه های علاقه تقسیم شود، بر اساس محتوایی که پخش می کنند، چقدر با هم تعامل دارند... اینجا می بینید که عکس قبلی اینگونه شده است:
در اینجا گروه ها به وضوح با رنگ متمایز می شوند. در این مورد، اینها دانشجویان کارشناسی ارشد ما در دانشکده عالی اقتصاد هستند. در اینجا میتوانید ببینید که بنفش/آبی کسانی هستند که به صفحات عمومی شفافیت بینالملل، روسیه باز و خودورکوفسکی علاقه دارند. پایین سمت چپ سبزها هستند، کسانی که روسیه متحد را دوست دارند.
می بینید که تصویر قبلی اینگونه بود (اینها فقط ارتباط بین افراد هستند) اما به وضوح مشخص شده است. یعنی همه مردم همیشه با هم در ارتباط هستند، علایق یکسانی دارند، با هم دوست هستند. برخی در بالا، برخی دیگر در پایین و برخی دیگر از رفقا آنجا هستند. و اگر هر یک از این زیرگراف های کوچک به طور جداگانه با پارامترهای دیگر تجسم شوند و به سرعت انتشار محتوا نگاه کنند (به طور کلی، چه کسی چه چیزی را در آنجا بازنشر می کند)، می توانید در هر قسمت یک یا دو نفر را پیدا کنید که همیشه افکار عمومی را در دست دارند. در تعامل با آن، درخواست ارسال نوعی پست یا چیز دیگری - می توانید از کل این مخاطب جالب پاسخ دریافت کنید.
من یک نمونه دیگر از این دست دارم. همچنین یک نمودار: اینها کارکنان گروه BBDO هستند که به عنوان نمونه در شبکه های اجتماعی یافت می شوند. به نظر می رسد غیر جالب، بزرگ، سبز، ارتباطات بین آنها ...
اما من گزینه ای دارم که در آن گروه ها از قبل بین آنها ساخته شده است. سپس، اگر کسی علاقه مند است، یک نسخه تعاملی وجود دارد - می توانید کلیک کنید و نگاهی بیندازید.
بالا سمت راست کسانی هستند که پوتین را دوست دارند. در اینجا بنفش ها طراحان هستند. کسانی که به طراحی، چیزهای جالب و غیره علاقه دارند. در اینجا چیزهای سفید تیم مدیریت هستند (ظاهراً همانطور که من متوجه شدم). اینها افرادی هستند که به طور کلی به هیچ وجه با هم ارتباط ندارند، اما تقریباً در همان موقعیت ها کار می کنند. بقیه گروه ها، ارتباطات و ... مشترک آنهاست.
برندها به وبلاگ نویسان نیاز ندارند، بلکه به رهبران عقیده نیاز دارند
ما این افراد را می گیریم و آنها را پیدا می کنیم - سپس آژانس تبلیغاتی، شرکت تبلیغاتی خودش تصمیم می گیرد: می تواند به این شخص پول بدهد تا او به نحوی با این محتوا، چیز دیگری تعامل داشته باشد یا کمپین تبلیغاتی خاص خود را به آنها هدایت کند. این نیز اغلب استفاده می شود، به خصوص در حال حاضر، زیرا همه برندها می خواهند با وبلاگ نویسان کار کنند، آنها می خواهند محتوای آنها تبلیغ شود، اما آژانس های تبلیغاتی واقعاً نمی خواهند با آنها تماس بگیرند (خوب، این اتفاق می افتد).
و راه واقعی برون رفت از این وضعیت یافتن افرادی است که وبلاگ نویس نیستند، وبلاگ نویسان زیبایی نیستند، اما برای مثال، برخی از موجودات واقعی که با این برند در تعامل هستند، که می توانند در برخی از صفحات عمومی بدبخت "پاسخ های Mail.ru" بنویسند. تعداد معینی بازدید این افراد که دائماً به محتوای این شخص علاقه مند هستند، همه چیز را پخش می کنند و برند درگیر آن خواهد شد.
گزینه دوم برای استفاده از چنین فناوری اکنون کاملاً مرتبط است - جستجوی ربات ها، مورد علاقه من. این یک خطر اعتباری برای رقبای شما است و فرصتی برای حذف افراد نامربوط از یک کمپین تبلیغاتی و هر چیز دیگری (حذف نظرات و جستجوی ارتباطات بین افراد). من چنین مثالی دارم، همچنین بزرگ و تعاملی است - می توانید آن را جابجا کنید. اینها ارتباط افرادی است که در انجمن لنتاچ نظر نوشته اند.
این مثال برای این است که متوجه شوید ربات ها چقدر خوب و به راحتی قابل مشاهده هستند. و برای این کار نیازی به داشتن دانش فنی ندارید. این بدان معناست که "لنتاچ" پستی در مورد تحقیقات FBK در مورد دیمیتری مدودف منتشر کرد و افراد خاصی شروع به نوشتن نظرات کردند. ما همه افرادی را که نظر نوشتند جمع آوری کردیم - این افراد سبز هستند. حالا من آن را منتقل می کنم:
مردم سبزها هستند (که نظرات را نوشته اند). آنها اینجا هستند، آنها اینجا هستند. نقاط آبی بین آنها گروه های مشترک آنها، نقاط زرد مشترکان، دوستان و غیره مشترک آنها هستند. اکثریت افراد با یکدیگر در ارتباط هستند. چون تئوری سه، چهار، پنج دست دادن هرچه که باشد، همه افراد در شبکه های اجتماعی به یکدیگر متصل هستند. هیچ آدمی نیست که از هم جدا باشد. حتی دوستان هراس اجتماعی من که به طور انحصاری از VKontakte برای تماشای ویدیوها استفاده می کنند، همچنان در برخی از صفحات عمومی مشابه ما مشترک هستند.
ناوالنی از ربات ها نیز استفاده می کند. همه ربات دارند
اکثر مردم (اینجاست، اینجا) با یکدیگر مرتبط هستند. اما گروه کوچکی از رفقا هستند که منحصراً با یکدیگر دوست هستند. اینجا آنها هستند، سبزهای کوچک، اینجا دوستان و گروه های مشترک آنها هستند. آنها حتی به طور جداگانه در اینجا سقوط کردند:
و در یک اتفاق خوش شانس، دقیقاً این افراد بودند که زیر این پست نوشتند: "ناوالنی هیچ مدرکی ندارد" و غیره همین نظرات را نوشتند. البته من جرات نتیجه گیری ندارم. اما با این وجود، من یک پست دیگر در فیس بوک داشتم، زمانی که مناظره بین لبدف و ناوالنی در جریان بود، نظرات را به همین ترتیب تجزیه و تحلیل کردم: معلوم شد که همه افرادی که نوشته اند "لبیدف چرند است"، در شبکه های اجتماعی نبوده اند. شبکه هایی که اخیراً چهار ماه است که در هیچ یک از صفحات عمومی مشترک نشده اند، ناگهان به این پست خاص رفتند، دقیقاً این نظر را نوشتند و رفتند. باز هم، نتیجه گیری از اینجا غیرممکن است، اما یکی از تیم ناوالنی برای من نظری نوشت که آنها از ربات ها استفاده نمی کنند. بسیار خوب!
به تبلیغات نزدیک تر، به برند نزدیک تر. الان همه ربات دارند! ما آنها را داریم، رقبای ما آنها را دارند و دیگران آنها را دارند. آنها را باید بیرون انداخت یا رها کرد تا خوب زندگی کنند. بر اساس چنین داده هایی (به اسلاید قبلی اشاره می کند) آنها را به کمال برسانید تا شبیه افراد واقعی به نظر برسند و تنها پس از آن از آنها استفاده کنید. اگرچه استفاده از ربات ها بد است! با این حال، یک داستان نسبتاً رایج ...
در حالت خودکار، چنین چیزی به شما این امکان را می دهد که افرادی را که به تجزیه و تحلیل بی ربط هستند، از تحلیل خود فیلتر کنید، افرادی که نباید در نمونه گنجانده شوند، نباید در این مطالعه گنجانده شوند. بسیار اغلب استفاده می شود. باز هم، همه دارندگان خودرو در واقع مالک خودرو نیستند. گاهی اوقات مردم فقط به افرادی علاقه دارند که به طور بالقوه ماشین دارند، در گروه هایی می نشینند، با یک نفر ارتباط برقرار می کنند، مخاطب خاصی در آنجا دارند.
تجزیه و تحلیل حقایق و نظرات
مورد بعدی که دارم نیز مورد علاقه من است. این تحلیل حقایق و نظرات است.
امروزه همه می دانند که چگونه برند خود را در منابع مختلف ذکر کنند. هیچ رازی در این مورد وجود ندارد. و به نظر می رسد که همه می توانند تونالیته را محاسبه کنند ... اگرچه شخصاً فکر می کنم خود متریک تونالیته چندان جالب نیست ، زیرا وقتی می آیید و به مشتری می گویید "مرد 37% خنثی داری" و او چنین می گوید. ، " وای! سرد!" بنابراین، جالب تر است که کمی جلوتر بروید: از ارزیابی احساسات گرفته تا ارزیابی نظرات آنها در مورد محصول شما.
و این هم خیلی چیز جالبی است، چون... من شخصاً معتقدم که اصولاً پیام های خنثی نمی تواند وجود داشته باشد، زیرا اگر فردی در فضای عمومی چیزی بنویسد، این پیام به هر نحوی رنگی می شود. من شخصاً هرگز پیامی خنثی در مورد نام تجاری ندیده ام. معمولاً نوعی خاک است.
اگر تعداد زیادی از این پیام ها را در نظر بگیریم (ممکن است میلیون ها، 10 میلیون باشد)، ایده اصلی هر پیام را برجسته کنیم، آنها را ترکیب کنیم، می توانیم کاملاً قابل اعتماد بفهمیم که مردم در مورد این برند چه می گویند، چه فکر می کنند. "من بسته بندی را دوست ندارم"، "من قوام را دوست ندارم" و غیره.
نظر مردم در مورد Transaero، Chupa Chups و رئیس جمهور ایالات متحده چیست؟
من یک مثال خنده دار دارم: این یک اینفوگرافیک است که نشان می دهد کاربران شبکه اجتماعی پس از ورشکستگی شرکت Transaero با آن چه می کنند.
نمونه های جالب زیادی در آنجا وجود دارد: بسوزانید، بکشید، به اروپا تبعید کنید، حتی 2٪ بودند که نوشتند - "آنها را برای عملیات نظامی به سوریه بفرستید." با حرکت از چیز خنده دار، می تواند تقریباً هر برندی باشد - از غذای سگ مورد علاقه من گرفته تا برخی از ماشین ها. هر کسی که بسته بندی را دوست ندارد، کسی که چیزهای واقعی را دوست ندارد - همیشه می توانید با این کار کنید، همیشه می توانید این را در نظر بگیرید. تعداد زیادی نمونه وجود دارد که مردم تقریباً تولید محصولات خود را تغییر دادند زیرا در شبکه های اجتماعی نوشتند که Chupa Chups به اندازه کافی گرد نیست یا به اندازه کافی شیرین نیست.
یک مثال خنده دار دیگر نیز وجود دارد. حدس بزنید چه نظراتی و درباره چه کسی؟
به دلایلی، در حال حاضر تجزیه و تحلیل نظرات، تجزیه و تحلیل حقایق استخراج شده از پیام ها، چندان مورد استفاده قرار نمی گیرد و چندان گسترده نیست. اگرچه این فناوری فوق سری نیست، اما عملاً هیچ دانش فنی در این زمینه وجود ندارد، زیرا از نظرات مردم، استخراج موضوع، محمول و گروه بندی آنها نیاز به یک نابغه در زبان شناسی محاسباتی ندارد. انجام آن چندان دشوار نیست. اما من امیدوارم که در چند سال آینده مردم شروع به استفاده از این کنند، زیرا ... بسیار عالی خواهد بود - این بازخورد خودکار است! شما همیشه می دانید که در مورد شما چه می گویند. خوب، میدانید که این درباره رئیسجمهور آمریکا ساخته شده است.
پاسخ به سوال حضار:
- بله، این فیس بوک به زبان انگلیسی است. آنها در اینجا به روسی ترجمه شده اند. این در جایی نوشته شده بود.
کلان داده و فناوری های سیاسی
در واقع، من نمونههای مختلف و جالبی از سیاست در مورد ترامپ و دیگران دارم، اما تصمیم گرفتیم آنها را به اینجا نیاوریم. اما یک نمونه سیاسی وجود دارد.
اینها انتخابات دومای دولتی است. کی بودی؟ سال گذشته؟ تقریبا یک سال و نیم پیش.
در اینجا افرادی هستند که توانسته اند مکان دقیق خود را تا یک نقطه جغرافیایی مشخص تعیین کنند تا بفهمند در کدام حوزه انتخاباتی قرار می گیرند. و سپس از این افراد فقط کسانی که نظر قطعی خود را اعلام کرده اند گرفته شد که به آنها رای می دادند.
از نظر فناوری سیاسی، این خیلی درست نیست، زیرا کل این موضوع باید با تراکم جمعیت و غیره عادی شود. با این وجود، آبیهای اینجا به شما رای میدهند، میدانید که قرمزها به رفقای مخالف رای میدهند، که اتفاقاً تعدادشان کم بود.
من شخصا معتقدم که Big Data به این زودی ها به فناوری های سیاسی نمی رسد، اما به عنوان یک گزینه، نامزد یک برند نیز هست. و این نیز تا حدودی، تجزیه و تحلیل حقایق و نظرات در مورد نام تجاری شما است و یک چیز نسبتاً جالب است، زیرا می توانید در زمان واقعی بفهمید که چه کسی در آنجا چه کاری انجام می دهد. من چندین مورد را از بی بی سی می شناسم، زمانی که آنها شبکه های اجتماعی را به صورت بلادرنگ در برخی از برنامه ها رصد کردند: پاسخ چنین و چنان است، مردم در مورد آن می نویسند، فلان سؤال را می پرسند - و این عالی است! فکر کنم خیلی زود استفاده بشه چون برای همه جالبه.
مدل سازی موقعیت های برند
بعد من مدل سازی موقعیت های برند را دارم. یک قطعه کوچک و کوتاه در مورد اینکه چگونه میتوانید برندها را با استفاده از معیارهای مختلف رتبهبندی کنید (نه از علاقه مشترکین در شبکههای اجتماعی، بلکه با استفاده از معیارهای پیچیده، علاقه به محتوا، زمان صرف شده برای دریافت معیارها).
من نمونه ای از "داروسازی" را به دلیل خاصی دارم. در اینجا دایره های کوچک داخلی و روشن هستند - این مقدار محتوای متنی است که خود برند ایجاد می کند، دایره بزرگ مقدار محتوای عکس و ویدیویی است که خود برند ایجاد می کند.
نزدیکی به مرکز نشان می دهد که محتوا چقدر برای مخاطب جذاب است. یک مدل بزرگ وجود دارد، مجموعهای از انواع پارامترها وجود دارد: لایکها، ارسالهای مجدد، زمان پاسخدهی، که به طور متوسط در آنجا به اشتراک گذاشته شده است... در اینجا میتوانید ببینید: یک "کاگوسل" فوقالعاده وجود دارد که مقدار زیادی از آن را پمپ میکند. برای ایجاد محتوای خاص خود پول پرداخت می کند و به همین دلیل آنها کاملاً به مرکز نزدیک هستند. و رفقای هم هستند که مطالب خود را می سازند اما مخاطب علاقه ای به آن ندارد. این مثال چندان مناسبی نیست، زیرا همه این حساب ها عملا مرده اند.
یگور کرید را بیشتر از باستا دوست دارند
متأسفانه بقیه... از چی نشون بدم... خب رپرهای روسی هم به عنوان گزینه از شرکت های واقعی هستن.
چه مزیتی دارد؟ واقعیت این است که یک شرکت می تواند تقریباً هر چیزی را در چنین مدلی قرار دهد، از میانگین حقوق مشترکینی که برای برند شما کار می کنند. هر مدلی که دوست دارند از آنجا که هر آژانس تبلیغاتی معیارهای خود را متفاوت محاسبه می کند، برندها معیارهای خود را متفاوت محاسبه می کنند.
در اینجا یکی نیز وجود دارد - Basta که حجم زیادی محتوا تولید می کند، اما در حاشیه قرار دارد، زیرا ظاهرا این محتوا برای مخاطبان جالب نیست. باز هم، من فکر نمی کنم قضاوت کنم. اما با این وجود ، یگور کرید وجود دارد که به گفته شبکه های اجتماعی تقریباً بهترین مجری زمان ما است ، اما فقط عکس های شخصی خود را منتشر می کند. با این وجود، او تعداد زیادی مشترک دارد: حدود یک میلیون نفر از آنها وجود دارد. عدد دقیق را به خاطر ندارم. به یاد دارم که درصد تعامل این افراد بسیار بیشتر از 85٪ است، یعنی به ازای هر میلیون مشترک، 850 هزار پاسخ از این افراد واقعی دریافت می کند - این یک جنون واقعی است. درست است.
پاسخ به سوالات حضار:
ایجاد مدل تحلیل رپر چقدر طول کشید؟
- هر کدام مخاطب هدف خود را دارد، علایق این افراد برای هر کدام محاسبه می شود... همه اینها تقریباً به فاصله تا مرکز عادی می شود، موقعیت شعاعی آنها مهم نیست (اینجا برای زیبایی به سادگی آغشته می شود تا آنها انجام دهند. با هم برخورد نکنند). فقط نزدیکی تقریبی به مرکز مهم است. این مدلی است که ما استفاده می کنیم. مثلا من دایره را بیشتر دوست دارم، بعضی ها آن را در ذهن به صورت نیم دایره انجام می دهند.
- این مدل به سرعت در دو سه ساعت (بله، یک نفر) جمع آوری شد. در اینجا فقط معیارهایی درج شد: آنچه را در چه ضرب می کنیم، جمع می کنیم و سپس به نوعی آن را عادی می کنیم. بستگی به مدل داره افرادی هستند که به میانگین حقوق (این شوخی نیست) مشترکان خود علاقه دارند. و برای این شما باید مخاطبین آنها را پیدا کنید، Avito، همه را محاسبه کنید، ضرب کنید. این اتفاق می افتد که مدت زیادی طول می کشد تا در نظر گرفته شود، اما به طور خاص این (به اسلاید قبلی اشاره می کند) - پارامترها در اینجا بسیار ساده هستند: مشترکین، ارسال مجدد و غیره. حدود دو تا سه ساعت طول کشید تا کامل شود. بر این اساس، این مورد در زمان واقعی به روز می شود و می توانید از آن استفاده کنید.
الان قسمت خوبش شروع میشود. من با مثال ها تمام شده ام، زیرا صحبت کردن برای مدت طولانی به تنهایی جالب نیست. و امیدوارم الان سوال بپرسید و در واقع از مبحثی به مبحث دیگر خواهیم رفت، زیرا من چنین نمونه هایی از نحوه استفاده از فناوری ها و غیره دارم...
پاسخ به سوالات حضار:
- من یک و تنها پرونده شخصی با یکی، به اصطلاح، «نزدیک کازینو» داشتم، وقتی دوربین در آنجا قرار میگرفت، چهرهها شناسایی میشدند و غیره. درصد افرادی که به رسمیت شناخته شده اند قطعاً بسیار زیاد است - هم از ما و هم رقبای ما. اما در واقع بسیار جالب است. من این را یک چیز جالب می بینم: شما می توانید درک کنید که این افراد چه کسانی هستند و به خوبی پیش بینی کنید که چرا دقیقاً به اینجا آمده اند، چه چیزی در زندگی آنها آنقدر تغییر کرده است که آنها تصمیم گرفتند به کازینو بیایند. اما در مورد انواع خاصی از تجارت ... اگر چنین چیزی را در داروخانه قرار دهید، هیچ فایده ای ندارد - نمی توانید پیش بینی کنید که چرا فردی به داروخانه آمده است.
وظیفه جهانی در اینجا این بود که یک مدل بسازیم تا بفهمیم چه زمانی یک فرد به طور بالقوه می خواهد به برند شما علاقه مند شود، به طوری که شما بتوانید نه پس از خرید چیزی (همانطور که اکنون اتفاق می افتد) به او تبلیغات بدهید، بلکه به او تبلیغات بدهید. در پیشبینی زمانی که این همه اتفاق میافتد. با چنین "کازینوی نزدیک" جالب بود. معلوم شد که درصد بسیار جالبی از این افراد وجود دارد - چرا: شخصی ناگهان ارتقاء یافت، شخص دیگری چیز دیگری دریافت کرد - چنین بینش جالبی. اما با برخی مغازه ها، با خرده فروشی، با فروشگاه نوعی قرص، به نظر من خیلی درست نخواهد بود.
آیا داده های بزرگ به صورت آفلاین استفاده می شود؟
- آفلاین بود شما فقط باید دقیقاً و تقریباً درک کنید که آیا این مدل مناسب است یا خیر. باز هم با آب گازدار... من در واقع به همه چیز علاقه دارم، اما شخصاً متوجه نمی شوم که چقدر پروفایل این افراد، رفتار آنها به زمانی بستگی دارد که می خواهند آب بطری بخرند. اگرچه این ممکن است واقعا درست باشد، من نمی دانم.
چند حساب رسانه اجتماعی باز وجود دارد؟
- ما به طور خاص 11 شبکه اجتماعی داریم - اینها "Vkontakte"، "Facebook"، "Twitter"، "Odnoklassniki"، "Instagram" و برخی چیزهای کوچک (من می توانم به لیست نگاه کنم، مانند "Mail.ru" و غیره) . در VKontakte ما قطعا یک کپی از همه این رفقا داریم. ما در VKontakte افرادی داریم - این 430 میلیون از همه کسانی است که تا به حال وجود داشته اند (از این تعداد حدود 200 میلیون دائماً فعال هستند). گروه هایی وجود دارد، بین این افراد ارتباط وجود دارد و محتوایی وجود دارد که به ما علاقه مند است (متن)، و بخشی از رسانه ها، اما بسیار کوچک... به طور کلی، ما به این تصویر نگاه می کنیم: اگر چهره هایی وجود دارد، ما آنها را ذخیره کنید، اگر میم وجود دارد، آنها را ذخیره می کنیم، ذخیره نمی کنیم، زیرا حتی ما به اندازه کافی برای ذخیره محتوای رسانه نداریم.
یک فیس بوک روسی زبان وجود دارد. الان یه جایی 60-80% Odnoklassniki هستن، تا یکی دو ماه دیگه احتمالا همه رو به آخر برسونیم. اینستاگرام روسی. برای همه این شبکه های اجتماعی گروه ها، افراد، ارتباط بین آنها و متن وجود دارد.
- حدود 400 میلیون نفر. یک نکته ظریف وجود دارد: افرادی هستند که شهر آنها مشخص نشده است (آنها بالقوه روسی / غیر روسی هستند). از این تعداد، میانگین شبکه های اجتماعی 14 درصد از حساب های بسته شده در VKontakte است، من رقم دقیق آن را در فیس بوک نمی دانم.
- ما همچنین رسانهها را در اینستاگرام ذخیره نمیکنیم - فقط در صورتی که چهرههایی در آنجا وجود داشته باشند. ما چنین محتوای رسانه ای (سایر) را ذخیره نمی کنیم. معمولاً جالب: فقط متن، ارتباط بین افراد. همه. رایجترین تحقیق در اینستاگرام، تحقیق معمول روی مخاطب است: این افراد چه کسانی هستند و مهمتر از همه ارتباط این افراد با سایر شبکههای اجتماعی. پروفایل این شخص را در Vkontakte و Facebook پیدا کنید تا سن او را محاسبه کنید و غیره.
- هنوز نیازی به پذیرش دیگران نیست - فقط به این دلیل که مشتری وجود ندارد. با توجه به زبان: ما روسی، انگلیسی، اسپانیایی داریم، اما هنوز هم منحصراً برای مارک های روسیه استفاده می شود. خوب، یا شرکت هایی که آنها را از روسیه می آورند.
- ما هر روز در رشتههای بسیار، بسیار، با افراد مصاحبه میکنیم: با جمعآوری وب دادهها را جمعآوری میکنیم و این شاخصها را با استفاده از Api بهروزرسانی میکنیم. در عرض 2-3 روز می توانید کل "VKontakte" را مرور کنید و از آنها عبور کنید. در عرض یک هفته می توانید کل فیس بوک را مرور کنید و بفهمید چه کسی چه چیزی را به روز کرده و چه چیزی را به روز نکرده است. و سپس این افراد را جداگانه جمع کنید: دقیقاً چه چیزی تغییر کرده است، کل این داستان را بنویسید. در تجربه من به ندرت از نمایه رسانه اجتماعی قدیمی شخصی برای اهداف تجاری واقعی استفاده شده است. این زمانی بود که یک شخصیت سیاسی درخواست داد و وظیفه او این بود که بفهمد چه افرادی به ستاد می آیند، این افراد 6-8 ماه پیش چه کسانی بودند (پروفایل خود را حذف کردند، اما در واقع برای یک نامزد دیگر، برگه های رای رسید. از بین بردن).
و چند بار - داستان های شخصی زمانی که عکس های شخصی در مالکیت عمومی منتشر شد. لازم بود ارتباطات و غیره پیدا شود. متأسفانه، حیف است، اما ما نمی توانیم در دادگاه شهادت بدهیم، زیرا پایگاه داده ما از نظر قانونی فاقد اعتبار است.
- ذخیره سازی MongoDB مورد علاقه من است.
شبکه های اجتماعی در تلاش برای مبارزه با جمع آوری داده ها هستند
- معمولا ما فقط لیستی از این اکانت ها را برای تبلیغ کنندگان آپلود می کنیم و بعد آنها از استاندارد استفاده می کنند... یعنی در شبکه های اجتماعی، در VKontakte می توانید لیستی از این افراد را مشخص کنید.
اما فیس بوک از کوکی های خریداری شده استفاده می کند. ما خودمان با کوکی ها کار نمی کنیم، اما چندین داستان وجود داشت که خود تبلیغ کننده به برخی افراد داد، ما با آنها تعامل داشتیم - آنها این شبکه ها را دارند، با تیزر، تبلیغات غیر تیزر، این "کوکی ها". شما می توانید آن را گره بزنید - بدون سوال! اما من واقعاً از این چیزها خوشم نمی آید زیرا فکر نمی کنم خیلی معتبر باشد. این کاملاً به نظر من است، مانند TNS است که تلویزیون ها را "ردیابی" می کند - مشخص نیست که آیا شما در حال تماشای این تلویزیون هستید یا نه، آیا در حال شستن ظرف ها در حالی که تلویزیون شما روشن است ... و اینجا هم همین طور است. : من اغلب در اینترنت چیزی را در گوگل جستجو می کنم، اما این بدان معنا نیست که می خواهم آن را بخرم.
- اگر از نوعی شبکه تبلیغاتی متنی استاندارد استفاده میکنید: من چندین داستان داشتم که این افراد را برایشان بارگذاری کردیم و سعی کردیم با استفاده از رابطهایشان، آنها را با «کوکیها» در سایتهایشان متصل کنیم. اما من واقعاً چنین چیزهایی را دوست ندارم.
فرمول محاسبه حقوق یک کاربر اینترنت
- فرمول کلی میانگین حقوق: این منطقه ای است که یک فرد در آن زندگی می کند، این دسته از مشاغلی است که در آن کار می کند (یعنی شرکتی که کارفرمای او است)، سپس موقعیت او در این شرکت گرفته می شود، میانگین حقوق برای این موقعیت تخمین زده می شود... میانگین حقوق گرفته شده از «هد شکارچی» و «سوپر شغل» (و چندین منبع دیگر وجود دارد) برای یک شغل خالی معین در یک منطقه معین و برای یک زمینه تجاری معین.
اگر شخصی تلفن را روشن کرده باشد، معمولاً از "Avito" و "Avto.ru" پارامترهای اضافی گرفته می شود. با Avito می توانید ببینید که شخص چه نوع چیزهایی را می فروشد - گران، ارزان، استفاده شده، استفاده نشده. با "Avto.ru" می توانید ببینید که آیا او یک ماشین دارد - او آن را دارد، او آن را ندارد. این جایی کمتر از 20٪ از افرادی است که به طور تصادفی تلفن خود را در جایی انداخته اند و حساب آنها را می توان با این داده ها مرتبط کرد.
شرکت جمع آوری داده ها در چه حجمی فعالیت می کند؟
- حجم عکس های ذخیره شده در پتابایت 6,4 است. اکنون نمی توانم دقیقاً نرخ رشد را بگویم، زیرا در سال 2016 ضبط "پریسکوپ" را شروع کردیم و تازه شروع به ضبط ویدیو کردیم.
دقیقا نمیتونم بگم کی صفر بوده ما از شرکتی به شرکت دیگر نقل مکان کردیم - اینها همه داستان های طولانی است. اما می توانم بگویم که VK، فیس بوک، اینستاگرام و توییتر - این همه تجارت (افراد، گروه ها و ارتباطات بین آنها) با متن و محتوا - در واقع داده های زیادی نیست، بعید است حتی یک پتابایت به اندازه کافی باشد. فکر کنم 700 گیگ باشه احتمالا 800.
آیا به مشتریان کمک می کنید تا جایگاه فعلی و محل حفاری را تعیین کنند؟
- وقتی مشتری می آید چنین کارهایی را به او پیشنهاد می کنیم اما خودمان مثل گوگل ترندز چنین کارهایی را انجام نمی دهیم.
- ما چندین داستان تقریباً جامعهشناختی داشتیم، با سابقه انتخاباتی و پیش از انتخابات - همه را تحلیل کردیم. با برندها و ارزیابی نظرات در مورد برندها، تقریباً همیشه همه چیز موافق است. در اینجا داستانهای انتخاباتی - نه (با ارزیابی اینکه کدام نامزد باید برنده شود) وجود دارد. من نمی دانم چه کسی در اینجا اشتباه می کند - ما یا کسانی که در VTsIOM فکر می کنند.
- معمولاً ما این نتایج کنترل را از خود برند می گیریم، آنها آن را از رفقای سفارش می دهند - تحقیقات تلفنی، تحقیقات بازاریابی و غیره. بعلاوه، کل این موضوع را می توان با چیزهای اساسی بررسی کرد: یک نفر به لیست پستی پاسخ داد، کسی نظرسنجی انجام داد ... اگر یک مارک بزرگ باشد (مثلاً کوکاکولا)، قطعاً یک میلیون یا دو بررسی داخلی از مشتریان دارند. - اینها فقط نظرات در شبکه های اجتماعی و برخی نظرات نیستند. اینها نوعی سیستم داخلی، بررسی و غیره هستند.
قانون "نمی داند" داده های شخصی چیست!
- ما منحصراً منابع داده باز را تجزیه و تحلیل می کنیم و هرگز درگیر هیچ ترفند کثیفی نمی شویم. مدل ما بر اساس این واقعیت ساخته شده است که ما همه داده های باز را در برخی از مراکز داده عمومی ذخیره می کنیم، آن ها را در جای دیگری اجاره می کنیم، و آن ها را در خانه، در دفاتر ما، در سرورهایمان تجزیه و تحلیل می کنیم، و به جایی خارج از قلمرو نمی رود.
اما قوانین ما در زمینه داده های باز بسیار مبهم است.
ما درک روشنی از اینکه دادههای باز چیست، دادههای شخصی چیست نداریم - این قانون 152 فدرال وجود دارد، اما هنوز... چگونه به حساب میآیند؟ حالا، اگر من نام شما و شماره تلفن شما را در یک پایگاه داده داشته باشم، در پایگاه داده دیگری شماره تلفن و ایمیل شما را دارم، در پایگاه داده سوم، مثلاً ایمیل شما و ماشین شما را دارم. به نظر می رسد همه اینها داده های غیر شخصی هستند. اگر همه اینها را کنار هم بگذارید، به نظر می رسد که طبق قانون به داده های شخصی تبدیل می شود.
ما از دو طریق این موضوع را دور می زنیم. اول اینکه یک سرور با نرم افزار برای کلاینت نصب می کند و سپس این داده ها از قلمرو او فراتر نمی رود و سپس کلاینت مسئولیت توزیع این داده های شخصی، داده های غیر شخصی و ... را بر عهده دارد. یا گزینه دوم: اگر این یک نوع داستان است که باید از یک شبکه اجتماعی یا چیز دیگری شکایت کنید ...
ما چنین مطالعه ای داشتیم زمانی که حساب های این رفقا را برای لایف نیوز جمع آوری کردیم (انتخابات مقدماتی روسیه یونایتد وجود داشت) و نگاه کردیم که آنها چه نوع پورن هایی را دوست دارند. چیز خندهداری بود، اما هنوز. ما این را به عنوان نظر شخصی خودمان می فروشیم، بدون اینکه به طور قانونی آنچه را که تجزیه و تحلیل کردیم در اسناد افشا کنیم - ثبت نام واحد دولتی اشخاص حقوقی، حقوق، شبکه های اجتماعی. ما نظر کارشناسی را می فروشیم و سپس در حاشیه به فرد توضیح می دهیم که چه چیزی و چگونه تجزیه و تحلیل کرده ایم.
چندین داستان وجود داشت، اما آنها مربوط به برخی از پروژه های تجاری عمومی بودند. به عنوان مثال، ما یک پروژه غیرانتفاعی رایگان برای کسانی داریم که سوار بردهای بلند می شوند (این تخته ها طولانی هستند): وظیفه جمع آوری نشریات مردم بود - وقتی کسی پست می کند "من برای سواری به پارک گورکی رفتم." و حالا او باید روی نقشه قرار بگیرد و اطرافیانش می توانند ببینند که کسی نزدیک اوست. VK برای مدت طولانی در مورد این موضوع با ما سر و صدا کرد، زیرا آنها از اینکه ما این اطلاعات را بدون اجازه مردم منتشر می کردیم خوششان نمی آمد. اما پس از آن موضوع به دادگاه نرسید، زیرا در چندین جامعه بزرگ ما به قوانین اضافه کردیم که داده ها می توانند توسط اشخاص ثالث، آژانس ها، شرکت ها، تجزیه و تحلیل ها و غیره استفاده شوند. - ما به موقع متوجه شدیم و شروع کردیم به فروش نظر کارشناسی خود به همه.
آیا با مؤسسات آموزشی کار می کنید؟
- ما با مؤسسات آموزشی همکاری می کنیم، بله. ما طیف گسترده ای داریم: ما یک برنامه کارشناسی ارشد در مدرسه عالی داریم و با دانشگاه های دیگر همکاری می کنیم. ما دانشگاه ها را خیلی دوست داریم!
- اگر مخاطبین من را دارید، می توانید برای من بنویسید. و پیوندی به ارائه، اگر کسی علاقه مند است - همه این نمونه ها وجود دارد، می توانید آن را منتقل کنید.
- اگر شماره تلفن، ایمیل را می دانید - این تقریباً صد در صد گزینه است، هیچ کس آن را حذف نخواهد کرد. اگر شماره تلفن وجود نداشته باشد، معمولاً یک تصویر است، اگر تصویر وجود ندارد، سال، محل زندگی، شغل است. یعنی بر اساس سال، محل سکونت و کار، تقریباً همه همیشه می توانند کاملاً ظریف شناسایی شوند. اما این، دوباره، یک سوال در مورد وظیفه است.
مثلاً مشتری داریم که تلویزیون اینترنتی می فروشد. شخصی اشتراک این «بازیهای تاج و تخت» را از آنها خرید و وظیفه این است که از CRM آنها برای یافتن این افراد در شبکههای اجتماعی و سپس یافتن افراد بالقوه از حوزه نفوذشان استفاده کند. فقط منظورم این است که آنها مثلاً نام، نام خانوادگی و ایمیل دارند... و سپس انجام هر کاری بسیار دشوار است. در بیشتر موارد، افراد را می توان از طریق ایمیل پیدا کرد.
- بر اساس ترکیب دوستانمان، ما معمولاً افراد را در شبکه های اجتماعی "همسان سازی" می کنیم، اما این همیشه درست نیست. این طور نیست که همیشه درست نیست - همیشه کار نمی کند. اولاً ، این کار مستلزم کار زیادی است ، زیرا این عملیات (تطبیق افراد) ابتدا باید برای هر یک از دوستان انجام شود - تا بفهمند آیا آنها از شبکه های اجتماعی آمده اند یا نه. و سپس - یک واقعیت ناشناخته برای هر کسی که در VKontakte ما دوستان مشابهی داریم، در فیس بوک ما دوستان متفاوتی داریم. نه برای همه، اما برای من، برای مثال، اینگونه است. و این برای اکثر مردم نیز صادق است.
کامل ترین داده ها چگونه جمع آوری می شوند؟
- نصب نرم افزار برای مشتری در کنار او. سروری روی آنها نصب شده است که فقط داده های عمومی را از ما می گیرد و داده های شخصی آنها را به صورت داخلی پردازش می کند. یک NDA با مشتری منعقد می شود. البته این خیلی درست نیست که آنها این را به ما منتقل کنند، اما مسئولیت قانونی بر عهده مشتری است - خوب، یعنی نصب نرم افزار برای او، یا انتقال داده های ناشناس. اما این بسیار نادر بود، زیرا - ناشناس سازی صحیح یا نادرست - در بیشتر موارد وابستگی بین این افراد از بین می رود.
چه کسی نرم افزار تشخیص چهره را می خرد؟
- ما در واقع به اینجا می رویم زیرا نرم افزار اصلی ما که می فروشیم جستجوی چهره، تجزیه و تحلیل همبستگی است و آن را به سازمان های دولتی می فروشیم. و یک سال و نیم پیش، ما تصمیم گرفتیم که همه این داستان ها را در تبلیغات، بازاریابی، و در بازار عمومی قرار دهیم - اینگونه بود که Social Data Hub، یک نهاد حقوقی تجاری، تشکیل شد. و حالا ما تازه به اینجا می آییم. ما الان یک سال و نیم است که اینجا پاتوق کرده ایم و سعی می کنیم به مردم توضیح دهیم که نیازی به دانلود با ذکر نیست، نیازی به پاسخ به سؤالات است، نیازی به تونالیته نیست. ، و غیره. بنابراین سخت است که بگوییم کجا ...
- (منظور شما کیست؟) به همه رفقای که باید به دنبال تروریست ها و پدوفیل ها باشند.
می توانم بلافاصله بگویم (این سوال بعدی خواهد بود): طبق داده های ما، هیچ معلمی به دلیل انتشار مجدد زندانی نشد. - در VKontakte - 14٪؛ در فیس بوک هیچ نمایه بسته ای وجود ندارد (لیست بسته دوستان و غیره وجود دارد). و جالب ترین چیز این است که من فقط یک پیام نوشتم - حالا آنها حساب می کنند و می گویند.
چیزی را پست نکنید که از آن خجالت بکشید!
- چیزی در شبکه های اجتماعی پست نکنید که باعث شرمندگی شما شود - من شخصاً این را دنبال می کنم. با اینکه خیلی شخصی داشتم، چون تو فیسبوک قسم میخورم. خوب، کاری وجود داشت و باید انجام می شد... چیزی که خجالت آور باشد پست نکنید! اگر قرار است بعداً در جایی در اتاق عمومی کار کنید، بله، بهتر است نظر ندهید. اگر قرار نیست این کار را انجام دهید، به طور کلی، هیچ کس اهمیتی نمی دهد. من فقط می توانم به شما اطمینان دهم که هیچ کس مکاتبات شخصی شما را نمی خواند و همه اینها کل این داستان را می سازد ...
هر هفته حتماً یک نفر به من مراجعه میکند و میگوید: «خب، عکسهای دوستم به یک صفحه عمومی ناشناس لو رفت! کمک! به هر حال، هرگز چیزی را در صفحات عمومی ناشناس منتشر نکنید.
- در مورد سایر سیستم های نظارتی اطلاعی ندارم - حتماً این را در نظر می گیریم که ذکر مارک منفی بود ، خدا ببخشد ... اما می توانم بگویم همه جور رفقای نزدیک به مردم فقط به فکر مردم هستند. که بیش از 5 هزار مخاطب دارند و افکار عمومی آنها می تواند بر کسی تأثیر بگذارد. طبق تجربه من، هرگز اتفاق نیفتاده است که آژانس منابع انسانی که ارزیابی پروفایل را از ما سفارش می دهد، بگوید: "هرکس ناوالنی را دوست دارد، کسی را استخدام نکنید!"
در مورد انتشار نتایج چند نفر در حوزه پژوهشی شاغل هستند؟
- از 10 شرکت تبلیغاتی برتر، هفت شرکت در حال انتشار هستند. سخت است بگوییم: وقتی یک سال و نیم پیش این کار را شروع کردیم... ما در هر منطقه چندین نفر داریم - چندین نفر در بانک ها هستند، چندین نفر در منابع انسانی هستند، چندین نفر در تبلیغات هستند. و اکنون به این فکر می کنیم که ابتدا به سراغ چه کسی برویم و برای چه کسی باید شروع به ساختن چند رابط کنیم...
- (در مورد تعداد افراد در هر بخش بازار) 25 نفر بیشتر نباشند، زیرا ما به کسی تجاوز نکردیم.
- به طور کلی، در اصل، این فن آوری های بازار، به نظر من، بیش از 50٪ استفاده می شود. برخی در کمپین های تبلیغاتی، برخی در نوعی تجزیه و تحلیل داخلی. من می گویم 40 درصد از آن در تجزیه و تحلیل داخلی استفاده می کنند، 50-60 درصد آن را به برندهای نهایی می فروشند. اما این در حال حاضر به خود شرکت های تبلیغاتی بستگی دارد. ببینید، برخی افراد صرفاً به خاطر پولی که خرج کردهاند، تبلیغاتی که انجام دادهاند گزارش میدهند، در حالی که برخی دیگر در مورد اینکه چند نفر آوردهاند، چه نوع مخاطبی مینویسند... من میگویم، اما ممکن است اشتباه کنم - نمیکنم. واقعا تصور نکنید که همه این رفقا چگونه کار می کنند. من فقط در داده های کمی می دانم.
چند تبلیغ 🙂
از اینکه با ما ماندید متشکرم آیا مقالات ما را دوست دارید؟ آیا می خواهید مطالب جالب تری ببینید؟ با ثبت سفارش یا معرفی به دوستان از ما حمایت کنید
Dell R730xd 2 برابر ارزان تر در مرکز داده Equinix Tier IV در آمستردام؟ فقط اینجا
منبع: www.habr.com