ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

ב-14 במרץ 2017, ארתור חצ'ויאן, מנכ"ל Social Data Hub, נאם בהרצאת BBDO. ארתור דיבר על ניטור אינטליגנטי, בניית מודלים התנהגותיים, זיהוי תכני תמונות ווידאו וכן כלים ומחקרים אחרים של Social Data Hub ומחקר המאפשרים למקד קהלים באמצעות רשתות חברתיות וטכנולוגיות Big Data.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

ארתור חצ'ויאן (להלן – ע"ה): - שלום! שלום לכולם! שמי ארתור חצ'ויאן, אני מנהל את חברת Social Data Hub, ואנחנו עוסקים בניתוחים אינטלקטואליים שונים ומעניינים של מקורות נתונים פתוחים, שדות מידע ועושים כל מיני מחקרים מעניינים וכדומה.

והיום עמיתים מקבוצת BBDO ביקשו מאיתנו לדבר על טכנולוגיות מודרניות לניתוח ביג דאטה, ביג דאטה ולא כל כך ביג דאטה לפרסום: איך משתמשים בו, הראו כמה דוגמאות מעניינות. אני מקווה שתשאלו שאלות בדרך, כי אני יכול לשעמם ולא לחשוף את המהות וכן הלאה, אז אל תתביישו.

למעשה, הכיוונים העיקריים, בכל מקום שבו נעשה שימוש בפתרונות "כמעט-ביג-דאטה", כולם ברורים - זה מיקוד קהל, ניתוח, ביצוע איזשהו מחקר שיווקי אנליטי. אבל תמיד מעניין אילו נתונים נוספים ניתן למצוא, אילו משמעויות נוספות ניתן למצוא לאחר יישום הניתוח.

למה אנחנו צריכים טכנולוגיה לפרסום?

איפה אנחנו מתחילים? הדבר הברור ביותר הוא פרסום ברשתות חברתיות. היום הורדתי את זה בבוקר: משום מה VKontakte חושב שאני צריך לראות את הפרסומת הספציפית הזו... אם זה טוב או רע זו השאלה השנייה. אנו רואים שאני בהחלט נכנס לקטגוריה של מתגייסים:

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

הדבר הראשון והמעניין ביותר שניתן לקחת כפתרון טכנולוגי... הדבר הראשון שרציתי להחליט לפני שנתחיל הוא להגדיר את המונחים: מה זה דטה פתוחה ומה זה ביג דאטה? כי לכל האנשים יש הבנה משלהם בעניין הזה, ואני לא רוצה לכפות את התנאים שלי על אף אחד, אבל... רק כדי שלא יהיו סתירות.

באופן אישי, אני חושב שמידע פתוח הוא כל מה שאני יכול להגיע אליו ללא שום התחברות או סיסמה. זה פרופיל פתוח ברשתות חברתיות, זה תוצאות חיפוש, אלו רישומים פתוחים וכו'. ביג דאטה, לפי ההבנה שלי, אני רואה את זה כך: אם זה לוחית נתונים, זה מיליארד שורות, אם זה סוג כלשהו של אחסון קבצים, זה איפשהו פטה-בייט של נתונים. השאר בטרמינולוגיה שלי זה לא ביג דאטה, אלא משהו כזה.

פרופיל דיוק גבוה וניקוד פרופיל

בוא נלך לפי הסדר. הדבר הראשון והמעניין ביותר שאתה יכול להמציא מניתוח מקורות נתונים פתוחים הוא פרופיל דיוק גבוה וניקוד פרופיל. מה זה? זהו סיפור שבו חשבון הרשת החברתית שלך יכול לחזות לא רק מי אתה, לא רק את תחומי העניין שלך.

אך כעת, באמצעות שילוב מקורות שונים, תוכלו להבין את גובה השכר הממוצע, כמה עולה הדירה שלכם והיכן היא ממוקמת. וכל הנתונים האלה יכולים לשמש ממש מאמצעים זמינים. לדוגמה, אם אתה לוקח את החשבון שלך ברשת חברתית, תסתכל, נניח, איפה אתה גר, איפה אתה עובד; להבין באיזה חלק של העסק נמצאת החברה בה אתה עובד; הורד משרות פנויות דומות מ-HH ו-"Superjob" אם אתה אנליסט, מנהל וכו'; תסתכל איפה אתה גר (בסיס, נניח CIAN), תבין כמה עולה לשכור בית במקום הזה, כמה עולה לקנות בית במקום הזה, חזה כמה אתה מרוויח בערך. יתרה מכך, באמצעות הרשתות החברתיות שלך, תוכל להבין כמה אתה נוסע, היכן אתה נמצא ועד כמה אתה נאמן למעסיק שלך.

בהתאם לכך, ממספר עצום כזה של מדדים אנחנו יכולים לעשות כל מה שנרצה. נוכל להכיר לך מוצר שמעניין אותך. האם אתה יכול לדמיין חנות מקוונת? אתה הולך לשם - החנות המקוונת הזו תופסת את החשבון שלך ברשת חברתית ואומרת לך: "מאשה, בדיוק נפרדת מהחבר שלך, הנה כמה מוצרים מסוימים בשבילך." זה לא העתיד הקרוב...

כיצד נקבע המיקום הגיאוגרפי של אדם?

תשובות לשאלות מהקהל:

  • בדרך כלל, 80% מכלל הצ'ק-אין נחשבים למקום המגורים המדויק. אבל לאנשים שלא עושים צ'ק אין בשום מקום, יש כמה אפשרויות: או צ'ק אין, או מיקום גיאוגרפי, או שזהו ניתוח של פוסטים ופרסומים במשך כל פרק הזמן שבו אדם כתב משהו... ואיפשהו, משהו יצוץ כמו "אני רוצה לקנות עגלה ליד Akademicheskaya" או "ראיתי לאחרונה גרפיטי מכוער על הקיר כאן." כלומר, עבור כמעט 80% מהאנשים ניתן לקבוע את מיקומם הגיאוגרפי, מקום עבודתם ומקום מגוריהם באמצעות נתונים או מטא נתונים שניתן לאסוף מרשתות חברתיות.

    זה, שוב, ניתוח של פוסטים. במובן הפשוט, מדובר בניתוח של צ'ק אין ומיקומים גיאוגרפיים ברשתות חברתיות, שלא מוחקות מטא נתונים של jpeg (אפשר להבין מזה משהו). אבל עבור האנשים הנותרים, אלה בדרך כלל שידורי טקסט: או שאדם "מזריק" את מיקומו כשהוא כותב על משהו, או שהוא "מזריק" בטלפון שלו, שבאמצעותו אתה יכול למצוא חלק מהפרסומות שלו ב-Avito או בחשבונו ב-" אוטומטי RU". בהתבסס על נתונים אלה, אתה יכול לשלב (לדוגמה, "אני מוכר מכונית ליד Mayakovskaya") ובערך להניח זאת.

  • אנשים בדרך כלל מפרסמים את זה ברשתות החברתיות. אנחנו עובדים רק עם מקורות פתוחים וכאן אנחנו מדברים אך ורק על מקורות פתוחים. בדרך כלל הם מפרסמים פרסומות, כלומר בשישים אחוז מהמקרים, הסיפור הנפוץ ביותר כאשר אנשים "הראו" את מספר הטלפון הנייד הנוכחי שלהם הוא פרסומות למכירה של משהו. או בקבוצות מסוימות אדם כותב ("אני מוכר את זה או את זה שם"), או הולך לאנשהו.

    כן! הם בדרך כלל מעירים כמו: "ענה לי או שלח לי SMS, התקשר למספר שלי. זה קורה לעתים קרובות מאוד לאנשים שמוכרים משהו, קונים משהו ברשתות חברתיות, מתקשרים עם מישהו... בהתאם, באמצעות המספר הזה תוכל לקשר אליו את הפרופיל שלו ב-CIAN, אם אי פעם פרסם משהו, או, שוב, ב- אביטו. אלה הם פשוט המקורות הכי פופולריים, מובילים, זה יהיה בהמשך - אלה הם Avito, CIAN וכן הלאה.

  • זה מתייחס לחנות מקוונת. בשלב הבא תהיה הטכנולוגיה של זיהוי פנים והתאמת פרופיל (אנחנו נדבר על זה). באופן תיאורטי בלבד, ניתן ליישם זאת על חנות לא מקוונת. ובכלל, החלום הגדול שלי הוא שכאשר מופיעים באנרים ברחוב, כשאתה עובר ליד מצלמה, זה "לוכד" את הפנים שלך. אבל המקרה הזה יהיה אסור על פי חוק כי מדובר בפגיעה בפרטיות. אני מקווה שזה יקרה במוקדם או במאוחר.
  • מניסיון אישי. לעתים קרובות מאוד, כשאדם כותב לך משהו, אתה פועל על כמה עובדות מחייו, שכאילו לא אמור לדעת... אנשים ברוב המקרים מפחדים. אבל! בהתבסס על נתונים סטטיסטיים עדכניים, מספר החשבונות הסגורים ברשתות החברתיות ירד ב-14%. מספר הזיופים גדל, מספר החשבונות הפתוחים גדל - אנשים הולכים יותר ויותר לקראת פתיחות. אני חושב שבעוד 3-4 שנים הם יפסיקו להגיב כל כך חזק לעובדה שמישהו יודע עליהם מידע שהוא פוטנציאלי לא אמור לדעת. אבל למעשה קל מאוד להגיע אליו על ידי התבוננות בקיר שלו.

מה אפשר לקחת ממקורות פתוחים?

יש רשימה משוערת של דברים שניתן להבין באמינות גבוהה למדי ממקורות פתוחים. למעשה, ישנם עוד יותר מדדים שונים; זה תלוי בלקוח של מחקר כזה. יש איזו סוכנות משאבי אנוש שמתעניינת אם אתה מקלל ברשתות חברתיות או איפשהו במרחב הציבורי. מישהו מתעניין אם אתה אוהב את הפרסומים של נבלני או, להיפך, פרסומים של רוסיה המאוחדת, או סוג של תוכן פורנוגרפי - דברים כאלה קורים לעתים קרובות למדי.

העיקריים שבהם הם ערכי משפחה, עלות משוערת של דירה, בית, חיפוש רכב וכדומה. על סמך זה ניתן לחלק אנשים לקבוצות חברתיות. מדובר במשתמשי טינדר במוסקבה, מי הם (לפי תמונותיהם שנמצאו בחשבונות הפייסבוק שלהם); בהתבסס על תחומי העניין שלהם, הם מחולקים לקבוצות חברתיות שונות:

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

אם נתקרב לפרסום, אז לאט לאט התרחקנו ממיקוד פרסום סטנדרטי, כאשר אתה בוחר ב-VKontakte שאתה מעוניין בגברים בני 18 המנויים לקבוצות מסוימות. יש לי את התמונה הבאה, אני אראה לך עכשיו:

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

השורה התחתונה היא שרוב השירותים הנוכחיים שמנתחים, באופן עקרוני, אנשים שמנתחים רשתות חברתיות, עוסקים בניתוח תחומי עניין... הדבר הראשון שעולה על דעתם של אנשים הוא לנתח את הקבוצות המובילות של המנויים שלהם. אולי זה עובד עבור חלק, אבל באופן אישי אני חושב שזה שגוי מיסודו. למה?

הלייקים שלך נאספים ומנתחים

עכשיו קח את הטלפונים שלך, תסתכל על הקבוצות המובילות שלך - בהחלט יהיו יותר מ-50% מהקבוצות שכבר שכחתם מהן, זה סוג של תוכן שהוא בעצם לא רלוונטי עבורכם. אתם לא צורכים את זה בכלל, אבל בכל זאת המערכת תעקוב אחריכם לפיהם: שנרשמתם למתכונים, לכמה קבוצות פופולריות. כלומר, תפר את המערכת שמנתחת את הפרופיל שלך, והאינטרסים שלך לא יהיו מוצדקים.

ממשיכים הלאה... מה יש? אנחנו מניחים מה אנשים אחרים עושים. לדעתנו, הדרך המתאימה ביותר להעריך את האינטרסים של המשתמשים היא לייקים. לדוגמה, ב-VKontakte אין הזנת לייקים, ואנשים חושבים שאף אחד לא יודע מה הם אוהבים. כן, חלק מהלייקים מוצגים באינסטגרם, אנחנו רואים משהו בפייסבוק, אבל רוב התוכן בקבוצות מסוימות לא משדר את זה בפיד משותף, ואנשים חיים וחושבים שאף אחד לא יידע מה הוא אוהב.

ועל ידי איסוף תוכן מסוים מסוג כלשהו שמעניין אותנו, איסוף הפוסטים הללו, איסוף הלייקים הללו, ואז בדיקת האדם הזה באמצעות מסד הנתונים הזה, נוכל לקבוע בדיוק רב מי הוא, מה ייעודו, במה הוא מעוניין. מקמו אותו בדיוק בקבוצה חברתית מסוימת ותקשרו איתו.

קניית רכב משנה התנהגות

יש לי דוגמה כזו. אני מיד אסתיג שהדוגמאות שלי הן כמעט פרסום וכמעט שיווק, כי, אתה יודע, רוב המקרים מוגנים על ידי NDA וכן הלאה. אבל עדיין יהיו הרבה דברים מעניינים. אז, הסיפור עם האנשים האלה: אלה גברים שקנו מכונית בין 2010 ל-2015. כיצד השתנתה ההתנהגות החברתית המקוונת שלהם מצוין בצבע. אחוז הבנות מבין המנויים השתנה, נרשמתי לדפים ציבוריים "נעריים", מצאתי שותף מיני קבוע...

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

כל העניין הזה מחולק לפי מותג רכב ומספר אנשים. מכאן אתה יכול להסיק מסקנות מעניינות רבות על התנהגותם של אנשים וכיצד הכל עובד. אני יכול לומר שהפורשה קאיין והפריורה הנטועה כמעט זהות מבחינת מספר הקהלים הנמשכים. האיכות של הקהל הזה וההתנהגות שלו שונים, אבל הכמות זהה בערך. המסקנה שאתה יכול להסיק מכאן היא מה שאתה רוצה, קרוב יותר לשוק שלך. אם אתה מוכר אודי, אתה עושה את הסלוגן "קנה אאודי ותתרחק מההורים שלך!" וכולי.

כן, זו דוגמה מצחיקה לעובדה שהתנהגות של אנשים על סמך ניתוח של לייקים, על סמך לאיזו קבוצה הם עוברים, איזה תוכן הם מנתחים - בסבירות של כמעט 100% זה מבהיר מי אתה. כי אם אין לך גישה לתעבורה ברשת ולא קורא הודעות אישיות, לייקים תמיד יגידו לך מי האדם הזה - אישה בהריון, אמא, איש צבא, שוטר. ועבורך, כאדם שיכול לפרסם, זו פגיעה גדולה במטרה.

תשובות לשאלות מהקהל:

  • כל עמודה היא מספר האנשים במכונית זו; כיצד השתנו דפוסי ההתנהגות שלהם. תראה: אנשים שקנו פורשה קאיין - בערך 550 איש (צהוב), אחוז הבנות בקרב המנויים גדל.
  • המדגם הוא משתמשי הרשתות החברתיות "Vkontakte", "פייסבוק", "אינסטגרם" מ-2010 עד 2015. ההבהרה היחידה: המכוניות שנבחרו כאן הן כאלו שניתן לזהות בצילומים עם יותר מ-80% דיוק באמצעות כלים מסוימים.
  • במשך תקופה מסוימת, המכונית שלו (טוב, כלומר, לא שלו, אנחנו משאירים את זה לרשתות החברתיות)... במשך תקופה מסוימת, אדם כל הזמן צולם עם המכונית, היה איתה, הפרסומים היו שונים, הצילומים היו מזוויות שונות, וכן הלאה. לאחר מכן תהיה תמונה של אילו אנשים מצלמים עם אילו מכוניות ו... כן, זו השאלה השנייה - אמון בנתוני הרשת החברתית.
  • מאז שהבאנו את זה, למרבה הצער, נתוני המדיה החברתית לא תמיד נכונים. אנשים לא תמיד נוטים לפרסם את המידע שלהם. באופן אישי ערכתי מחקר כזה: השוויתי את מספר הבוגרים של אוניברסיטאות במוסקבה עם מספר האנשים הרשומים ברשתות חברתיות. בממוצע, 60% יותר אנשים רשומים ברשתות החברתיות - בוגרי אוניברסיטת מוסקבה בשנה מסוימת בהתמחויות מסוימות - ממה שיש בפועל באופן עקרוני. אז כן – יש כאן, באופן טבעי, אחוז טעויות, ואף אחד לא מסתיר את זה. כאן אנו פשוט לוקחים כבסיס את אותן מכוניות שניתן לזהות בסבירות של יותר מ-80%.

רשימת מקורות להכשרת מודלים

לפניכם רשימה לדוגמה של מקורות שניתן להשתמש בהם, המשמשת לקבוע בוודאות רבה את הפרופיל החברתי של אדם, מי הוא.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

אנחנו לוקחים פרופיל מרשתות חברתיות, מ-CIAN - עלות הדירה היא בקירוב, "הד-האנטר", "Superjob" - זה השכר הממוצע לאדם נתון. אני מקווה שאין כאן נציגי Head Hunter, כי הם חושבים שזה לא ממש טוב לקחת מהם את הנתונים האלה. עם זאת, זהו השכר הממוצע באזורים מסוימים עבור סוגים מסוימים של פעילויות למשרות פנויות.

"Avito", "Avto.ru": לעתים קרובות אנשים, כשהטלפון שלהם מואר, בהחלט יש להם את זה (במספר רב של מקרים) לפחות משהו ב-"Avito", או ב-"Avto.ru", או בעוד כמה אתרים שמהם אתה יכול להבין מי הם. אם נמכרה עגלה או מכונית במספר טלפון זה... Rosstat ומרשם הישויות המשפטיות המאוחדות הן עדיין יותר רישומים שבעזרתם ניתן לדרג את החברה המעסיקה - לפי נוסחה כלשהי, לפי מודל ש כל אדם יכול להגדיר (אתה יכול לקבוע בערך את הכסף של האדם הזה וכו').

טינדר עוזרת לאסוף נתונים על מצבם של אנשים

בנוסף, יש דבר כל כך מעניין (לחלופין, זה מאוד מצחיק במחקר) - זהו, שוב, אוסף הנתונים מטינדר מוסקבה באמצעות בוטים עבור הטינדר הזה. המרחק לאנשים נקבע, ולאחר מכן נקבע מיקומם המשוער.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

מטרת מחקר זה הייתה לקבוע את מספר חשבונות טינדר בשטח מוסדות ממשלתיים - בדומא, בפרקליטות וכן הלאה. אבל אתה, כמפרסם, יכול לדמיין מה שאתה רוצה: זה יכול להיות, למשל, סטארבקס או מישהו אחר... כלומר, מספר האנשים בטינדר ששותים ממך קפה, מזמינים משהו, נמצאים בחנויות לגבי מיקום גיאוגרפי זה: ניתן לעשות זאת עם כל שירות.

תשובה לשאלה מהקהל:

  • חומר דליק? אתה לא יודע? טינדר היא אפליקציית היכרויות שבה אתה מסתכל דרך תמונות (שמאל-ימין), והאפליקציה הזו מראה לך את המרחק לאדם. אם אתה מקבל את המרחק לאדם זה משלוש נקודות שונות, אתה יכול לקבוע את המיקום בקירוב (+ 5-7 מטרים). במקרה זה, להכרעה בשטח הפרקליטות או בדומא המדינה, זה לא כל כך קשה. אבל שוב, זה יכול להיות החנות שלך, זה יכול להיות כל דבר.

למשל, לפני הרבה מאוד זמן היה לנו מקרה כזה (לא מחקר), כשקיבלנו מאחת ממפעילות הסלולר נתונים על צפיפות התנועה, נתונים על צפיפות התנועה של נקודות סלולריות, וכל המידע הזה הוחלף. על הקואורדינטות של שלטי חוצות הממוקמים על כבישים מהירים. והמשימה של מפעילת הסלולר היא לקבוע בערך כמה אנשים עוברים במקום ויכולים לראות את הפרסומת שלט החוצות הזו.

אם יש כאן מומחי פרסום שלטי חוצות, אפשר לומר: אי אפשר להבין באמינות-על - מישהו בא, מישהו לא הסתכל, מישהו הסתכל... בכל זאת, זו דוגמה לכך שיש 20 מיליארד מצולעים של אלה במוסקבה, שעליהן צפיפות האנשים האלה בכל שעה לאורך מסלולים מסוימים... אתה יכול לראות מה האנשים האלה עברו בכל רגע ולהעריך באופן גס את זרימת הנוסעים.

תשובה לשאלה מהקהל:

  • אף אחד לא נותן נתונים כאלה. ערכנו מחקר כזה עבור אחד המפעילים; זהו סיפור פנימי בלעדי, ולכן, למרבה הצער, הוא לא מוצג בצורת תמונות. אבל לעתים קרובות למשרדי פרסום גדולים אין בעיה ליצור קשר עם מפעיל. לפחות במוסקבה, ישנם תקדימים רבים כאשר, למשל, חברות ביטוח פונות לחברות כמו GetTaxi, המספקות נתונים לא אישיים על גיל הנהג, איך הם נוהגים (טוב - רע, פזיז - לא), על מנת לחזות מדיניות וכן הלאה. כולם נאבקים עם זה, אבל ברמה פנימית כלשהי, מתן נתונים אנונימיים - אני חושב שלאף אחד אין בעיה כזו.

זיהוי תמונה ותבניות

לך על זה. האהוב עלי הוא זיהוי תמונה. תהיה קטע קטן על חיפוש אנשים לפי פרצופים, אבל אנחנו לרוב לא לוקחים את החלק הזה. אנחנו לוקחים במיוחד זיהוי תמונה וקובעים מה יש בתמונה הזו - מותג המכונית, הצבע שלה וכו'.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

יש לי את הדוגמה המצחיקה הזאת:

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

היה מחקר כזה על חיפוש קעקועים ברשתות חברתיות שונות. בהתאם, ניתן ליישם את אותו הדבר על כל מותג, על כל תמונה ויזואלית, כמעט על כל תמונה ויזואלית. יש כאלה שלא ניתן לקבוע בצורה מהימנה (אנחנו לא לוקחים אותם).

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

הנה הפייבוריט שלי. מותגי רכב פונים לא מעט למשימה הזו כי המשימה שלהם, למשל, היא למצוא את כל הבעלים של איזה BMW X6, להבין מי הם, איך הם מחוברים זה לזה, במה הם מתעניינים וכו'. זה קשור לשאלה עם אילו מכוניות אנשים מצלמים ברשתות החברתיות.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

לא היה כאן סינון כלל: החפץ היה שלהם, המכונית לא הייתה שלהם; זה רק התמוטטות של מכוניות - גיל וכן הלאה. אבל זיהוי תמונה חזותי משמש לעתים קרובות למדי: זהו החיפוש אחר נשים בהריון, וחיפוש אחר לוגו של מותג בסוג של תקשורת המונים (מי מפרסם מה).

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

המקרה האהוב עליי (שמשתמשים בו במסעדות שונות): איזה לחמניות מתפרסמות ברשת חברתית. זה דבר מצחיק, אבל למעשה זה מאפשר לך להבין הרבה דברים מעניינים, ראשית, על הלקוחות שלך: מי הגיעו אליך ולמה הם עשו את זה. כי זה לא סוד שבסושי ברים רוב האנשים (לא אגיד "בנות") מצלמים כדי לעשות צ'ק אין, לצלם משהו וכו'.

המותג יכול לנצל זאת. המותג מתעניין איזה סוג של מוצרים הוא צריך כדי לצלם יפה ולפרסם, איזה סוג של אנשים הגיעו לשם. את הדבר הזה אפשר לעשות כמעט עם כל דבר, החל מאוכל.

זיהוי דפוסי וידאו

תשובה לשאלה מהקהל:

  • לא בווידאו. יש לנו את זה במצב בדיקה. ניסינו את הטכנולוגיה הזו, אבל מסתבר ש... היא מזהה הכל עם וידאו די טוב, אבל לא מצאנו לה אפליקציה בשום מקום. ביי. חוץ מלנתח כמה ואיזה בלוגרים וידאו מדברים איפשהו... היה מחקר כזה. כמה מהפנים שלהם נפגשים, באיזו תדירות. אבל מותגים עדיין לא הבינו איפה להמציא את זה. אולי מתישהו זה יגיע.

שוב, זה אוכל, זה יכול להיות נשים בהריון, גברים (לא בהריון), מכוניות - כל דבר.

כאופציה, היה מחקר לשנה החדשה עבור כלי תקשורת אחד. גם רחוק מפרסום, אבל עדיין. זה סוג האוכל שאנשים צמו לקראת השנה החדשה:

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

זה גם מחולק לפי גיל כאן. אפשר לראות מתאם כזה שצעירים מזמינים בעיקר אוכל, מבוגרים בעיקר מכינים שולחן מסורתי. זה דבר מצחיק, אבל כשמדמיינים את זה כבעלים של מותג, אתה יכול להעריך מספר רב של דברים: מי מטפל במוצר שלך ואיך, מה הם כותבים עליו. לעתים קרובות, אנשים לא תמיד מזכירים את המותג עצמו בטקסט, ומערכות ניטור אנליטיות מסורתיות לא תמיד יכולות להבין ולמצוא אזכור זה של המותג רק בגלל שהוא לא מוזכר בטקסט. או שהטקסט מאויית שגוי, אין תגי hash או משהו.

התמונות גלויות. עם צילום, אתה יכול לדעת אם זה הנושא המרכזי של הפריים או לא הנושא המרכזי של הפריים. אז אתה יכול לראות מה האדם הזה כתב. אבל לרוב זה משמש כחיפוש אחר קהלים פוטנציאליים שנסעו במכוניות מסוימות וכן הלאה. ואז נעשה הרבה דברים מעניינים עם המכוניות האלה.

בוטים מלמדים לחקות בני אדם

הייתה גם אפשרות כזו לשימוש בספירת אנשים:

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

יש אפשרות להשוות בין אנשים, כאשר אתה צריך למצוא אנשים באמצעות כמה תמונות, להבין את הפרופיל החברתי שלהם, מי הם. שוב, נחזור לשאלה שאם יש לנו מצלמה בחנות לא מקוונת, אז זו דרך די טובה להבין מי בא אליך, מי האנשים האלה, במה הם מתעניינים, מה גרם להם להגיע אליך .

לאחר מכן מגיע הדבר המעניין ביותר: אם נאסוף את החשבונות שלהם ברשתות חברתיות, נבין מי האנשים האלה, במה הם מתעניינים, נוכל (כאופציה) ליצור בוט דומה לאנשים האלה; הבוט הזה יתחיל לחיות כמו האנשים האלה ולנתח אילו פרסומות הוא רואה ברשתות חברתיות שונות. זה יאפשר לך להבין במדויק אילו מותגים מכוונים לאדם זה. זהו גם סיפור נפוץ למדי כאשר אתה צריך לא רק לנתח מי האדם הזה ואיזה תחומי עניין יש לו, אלא גם לאיזה סוג פרסום המתחרים הפוטנציאליים שלך או מתעניינים אחרים צריכים לכוון.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

ניתוח קשרים ברשתות חברתיות

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

הדבר המעניין הבא הוא ניתוח היחסים בין אנשים. למעשה, ניתוח החיבורים ברשת, גרפי הרשת האלה - אין בזה קצת, שום דבר חדש, כולם יודעים את זה.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

אבל היישום למשימות פרסום הוא המעניין ביותר. זהו חיפוש של אנשים שקובעים טרנדים, זהו חיפוש של אנשים שמפיצים מידע לפי קריטריונים מסוימים בתוך הרשת הזו. נניח שאנו מעוניינים באותם בעלים של דגם מסוים של ב.מ.וו. על ידי חיבור של כולם, נוכל למצוא את אלה השולטים בדעת הקהל. אלה לא בהכרח בלוגרים בתחום הרכב וכן הלאה. בדרך כלל מדובר בחברים פשוטים שיושבים בדפים ציבוריים שונים, מתעניינים בתוכן כלשהו ויכולים תוך פרק זמן קצר מאוד למשוך את המותג שלך או מישהו שמעניין אותך לתחום האחריות הזה, לתחום של עניין.

יש כאן דוגמה כזו. יש לנו כמה אנשים פוטנציאליים, קשרים בין אנשים. כאן הכתומים הם אנשים, הנקודות הקטנות הן קבוצות משותפות, חברים משותפים.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

אם אוספים את כל הקשרים האלה ביניהם, אפשר לראות בצורה מאוד ברורה שיש אנשים שיש להם מספר רב של קבוצות משותפות, חברים משותפים, הם שם בינם לבין עצמם... ואם אותה הדמיה מחולקת לקבוצות לפי תחומי עניין, לפי תוכן, שהם מפיצים, עד כמה הם מקיימים אינטראקציה זה עם זה... כאן תוכלו לראות שהתמונה הקודמת הפכה כך:

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

כאן הקבוצות נבדלות בבירור לפי צבע. במקרה זה, מדובר בתלמידי התואר השני שלנו בבית הספר הגבוה לכלכלה. כאן אתה יכול לראות שהסגולים/כחולים הם אלה שאוהבים את Transparency International, Open Russia והדפים הציבוריים של חודורקובסקי. משמאל למטה הם הירוקים, אלה שאוהבים את רוסיה המאוחדת.

אפשר לראות שהתמונה הקודמת הייתה כזו (אלו רק קשרים בין אנשים), אבל הפכה לתחום בצורה ברורה. כלומר, כל האנשים תמיד מחוברים זה לזה, יש להם אותם תחומי עניין, הם חברים זה עם זה. יש כמה למעלה, אחרים למטה, ועוד כמה חברים שם. ואם כל אחד מהתתי-גרפים הקטנים האלה מוצג בנפרד עם פרמטרים אחרים ומסתכל על מהירות הפצת התוכן (בערך, מי מפרסם מחדש מה שם), אפשר למצוא בכל חלק אדם אחד או שניים שתמיד מחזיקים בידיהם את דעת הקהל, אינטראקציה איתה, לבקש לשלוח פוסט כלשהו או משהו אחר - אתה יכול לקבל תגובה מכל הקהל המעניין הזה.

יש לי עוד דוגמה כזו. גם גרף: אלו עובדי קבוצת BBDO שנמצאו ברשתות החברתיות כדוגמה. זה נראה לא מעניין, גדול, ירוק, קשרים ביניהם...

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

אבל יש לי אפשרות שבה כבר בנויות ביניהן קבוצות. לאחר מכן, אם מישהו מעוניין, יש גרסה אינטראקטיבית - אפשר ללחוץ ולהציץ.

מימין למעלה הם אלה שאוהבים את פוטין. כאן הסגולים הם המעצבים; כאלה שמתעניינים בעיצוב, משהו מעניין וכו'. כאן הדברים הלבנים הם צוות ההנהלה (כנראה, כפי שהבנתי); מדובר באנשים שבאופן כללי לא קשורים בשום צורה, אלא עובדים בערך באותם תפקידים. השאר זה הקבוצות המשותפות שלהם, קשרים וכו'.

מותגים לא צריכים בלוגרים, אלא מובילי דעה

אנחנו לוקחים את האנשים האלה ומוצאים אותם - ואז משרד הפרסום, חברת הפרסום מחליט בעצמו: הוא יכול לתת כסף לאדם הזה כדי שהוא יתקשר איכשהו עם התוכן הזה, משהו אחר, או יפנה אליהם את קמפיין הפרסום הספציפי שלו. זה גם משמש לעתים קרובות למדי, במיוחד עכשיו, כי כל המותגים רוצים לעבוד עם בלוגרים, הם רוצים שהתוכן שלהם יקודם, אבל משרדי פרסום לא באמת רוצים ליצור קשר (טוב, זה קורה).

והדרך האמיתית לצאת מהמצב הזה היא למצוא אנשים שאינם בלוגרים, לא בלוגרי יופי, אלא למשל, כמה יצורים אמיתיים שמקיימים אינטראקציה עם המותג הזה, שיכולים לכתוב באיזה דף ציבורי עלוב "תשובות Mail.ru", לקבל מספר מסוים של צפיות. האנשים האלה, שמתעניינים כל הזמן בתוכן של האדם הזה, יפיצו את כל העניין, והמותג יקבל את מעורבותו.

האפשרות השנייה לשימוש בטכנולוגיה כזו עכשיו היא די רלוונטית - חיפוש בוטים, המועדף עלי. זהו סיכון מוניטין עבור המתחרים שלך, והזדמנות לנשל אנשים לא רלוונטיים מקמפיין פרסומי, וכל דבר אחר (מחיקת תגובות, וחיפוש קשרים בין אנשים). יש לי דוגמה כזו, היא גם גדולה ואינטראקטיבית - אפשר להזיז אותה. אלו קשרים של אנשים שכתבו תגובות בקהילת לנטח.

הדוגמה הזו היא כדי שתבינו עד כמה בוטים נראים בקלות; ולשם כך אין צורך בידע טכני כלשהו. זה אומר ש"לנטח" פרסם פוסט על חקירת ה-FBK על דמיטרי מדבדב, ואנשים מסוימים החלו לכתוב תגובות. אספנו את כל האנשים שכתבו תגובות - האנשים האלה ירוקים. עכשיו אני אעביר את זה:

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

האנשים הם הירוקים (שכתבו את התגובות). הם כאן, הם כאן. הנקודות הכחולות ביניהן הן הקבוצות המשותפות שלהם, הנקודות הצהובות הן המנויים, החברים המשותפים שלהם וכו'. רוב האנשים קשורים זה לזה. כי לא משנה מה התיאוריה של שלוש, ארבע, חמש לחיצות ידיים, כל האנשים מחוברים זה לזה ברשתות החברתיות. אין אנשים שנפרדים זה מזה. אפילו החברים שלי הפוביים מבחינה חברתית שמשתמשים ב-VKontakte באופן בלעדי לצפייה בסרטונים עדיין רשומים לחלק מאותם דפים ציבוריים כמונו.

נבלני גם משתמש בבוטים. לכולם יש בוטים

רוב האנשים (הנה זה, כאן) קשורים זה לזה. אבל יש קבוצה כל כך קטנה של חברים שהם חברים בלעדי זה עם זה. הנה הם, הירוקים הקטנים, הנה החברים והקבוצות המשותפים שלהם. הם אפילו נפלו בנפרד כאן:

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

ובצירוף מקרים מזל, דווקא האנשים האלה כתבו מתחת לפוסט הזה: "לנבלני אין ראיות" וכן הלאה, וכתבו את אותן הערות. כמובן, אני לא מעז להסיק מסקנות. אבל בכל זאת, היה לי עוד פוסט בפייסבוק, כשהיה ויכוח בין לבדב לנבלני, ניתחתי את התגובות באותו אופן: התברר שכל האנשים שכתבו "לבדב זה חרא", הם לא היו ב-social. רשתות לאחרונה ארבעה חודשים, לא נרשמו לאף אחד מהעמודים הציבוריים, פתאום נכנסו לפוסט הספציפי הזה, כתבו את התגובה המדויקת הזו ועזבו. שוב, אי אפשר להסיק מכאן מסקנות, אבל מישהו מהצוות של נבלני כתב לי תגובה שהם לא משתמשים בבוטים. טוב בסדר!

קרוב יותר לפרסום, קרוב יותר למותג. לכולם יש בוטים עכשיו! יש לנו אותם, למתחרים שלנו יש אותם, ולאחרים יש אותם. יש לזרוק אותם או להשאירם לחיות טוב; בהתבסס על נתונים כאלה (מצביעים על השקף הקודם), הביאו אותם לשלמות כך שיראו כמו אנשים אמיתיים ורק אז השתמשו בהם. למרות ששימוש בבוטים זה רע! עם זאת, סיפור די נפוץ...

במצב אוטומטי, דבר כזה מאפשר לך לסנן מהניתוח שלך אנשים שאינם רלוונטיים לניתוח, אנשים שלא צריכים להיכלל במדגם, לא צריכים להיכלל במחקר הזה. משמש לעתים קרובות מאוד. שוב, לא כל בעלי המכוניות מחזיקים בפועל מכוניות. לפעמים אנשים מתעניינים רק באנשים שיש להם אולי מכונית, שיושבים בכמה קבוצות, מתקשרים עם מישהו, יש להם קהל מסוים שם.

ניתוח עובדות ודעות

הבא שיש לי הוא גם האהוב עליי. זהו ניתוח של עובדות ודעות.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

כיום כולם יודעים להזכיר את המותג שלו במקורות שונים. אין בזה סוד. ונראה שכולם מסוגלים לחשב טונאליות... למרות שבאופן אישי, אני חושב שמדד הטונאליות עצמו לא מאוד מעניין, כי כשאתה בא ואומר ללקוח, "גבר, יש לך 37% ניטרלי", והוא אומר כך. , " וואו! מגניב!" לכן, יהיה מעניין יותר להתקדם קצת יותר: מהערכת סנטימנט להערכת הדעות של מה שהם אומרים על המוצר שלך.

וזה גם דבר מאוד מעניין, כי... אני אישית מאמין שבאופן עקרוני לא יכולים להיות מסרים ניטרליים, כי אם אדם כותב משהו במרחב הציבורי, המסר הזה הוא איכשהו צבעוני באיזשהו אופן. אני אישית אף פעם לא ראיתי מסר ניטרלי שמזכיר מותג. בדרך כלל זה סוג של לכלוך.

אם ניקח מספר גדול מההודעות הללו (יכולים להיות מיליונים, 10 מיליון), נדגיש את הרעיון המרכזי מכל הודעה, נשלב אותם, נוכל להבין בצורה מהימנה למדי מה אנשים אומרים על המותג הזה, מה הם חושבים. "אני לא אוהב את האריזה", "אני לא אוהב את העקביות", וכן הלאה.

מה אנשים חושבים על Transaero, Chupa Chups ונשיא ארצות הברית?

יש לי דוגמה מצחיקה: זו אינפוגרפיקה על מה שמשתמשי הרשת החברתית היו עושים עם חברת Transaero לאחר פשיטת הרגל שלה.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

יש שם הרבה דוגמאות מעניינות: לשרוף, להרוג, לגרש לאירופה, היו אפילו 2% שכתבו - "שלח אותם לסוריה למבצעים צבאיים". אם נמשיך מהדבר המצחיק, זה יכול להיות כמעט כל מותג - ממזון הכלבים האהוב עליי ועד כמה מכוניות. מי שלא אוהב את האריזה, מי שלא אוהב דברים אמיתיים - אתה תמיד יכול לעבוד עם זה, אתה תמיד יכול לקחת את זה בחשבון. יש מספר רב של דוגמאות כאשר אנשים כמעט שינו את הייצור של המוצרים שלהם כי הם כתבו ברשתות החברתיות ש-Chupa Chups לא מספיק עגול או שהוא לא מספיק מתוק.

יש עוד דוגמה מצחיקה. נחשו אילו הערות ועל מי?

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

משום מה, כעת ניתוח הדעות, ניתוח העובדות המופקות מהודעות, אינו בשימוש רב ואינו נפוץ במיוחד. למרות שהטכנולוגיה הזו אינה סודית במיוחד, אין בכך כמעט שום ידע, כי מהערות של אנשים, חילוץ הנושא, הפרדיקט וקיבוץ שלהם לא דורש גאון בבלשנות חישובית. זה לא כל כך קשה לעשות. אבל אני מקווה שבשנתיים הקרובות אנשים יתחילו להשתמש בזה, כי... זה יהיה מגניב - זה משוב אוטומטי כזה! אתה תמיד יודע מה אומרים עליך. ובכן, אתה מבין שזה נכתב על נשיא ארה"ב.

תשובה לשאלה מהקהל:

  • כן, זה פייסבוק באנגלית. הם מתורגמים כאן לרוסית. זה נכתב איפשהו.

ביג דאטה וטכנולוגיות פוליטיות

למעשה, יש לי דוגמאות רבות ושונות של פוליטיקה לגבי טראמפ וכל השאר, אבל החלטנו לא להביא אותן לכאן. אבל יש דוגמה פוליטית אחת.

אלו בחירות לדומא הממלכתית. מתי היית? שנה שעברה? לפני כמעט שנה וחצי.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

הנה אנשים שהצליחו לקבוע את מיקומם המדויק, עד לנקודת גיאו מסוימת, כדי להבין לאיזה מתחם בחירות הם נופלים. ואחר כך נלקחו מהאנשים האלה רק אלה שהביעו את דעתם הנחרצת, להם יצביעו.

מנקודת מבט של טכנולוגיה פוליטית, זה לא מאוד נכון, כי צריך לנרמל את כל העניין הזה על ידי צפיפות האוכלוסין וכן הלאה. למרות זאת, הכחולים כאן הולכים להצביע עבור אתה יודע מי, האדומים הולכים להצביע עבור החברים מהאופוזיציה, שדרך אגב, לא היו הרבה מהם.

אני אישית מאמין שביג דאטה לא יגיע לטכנולוגיות פוליטיות בזמן הקרוב, אבל, כאופציה, המועמד הוא גם מותג. וזה גם, במידה מסוימת, ניתוח של עובדות ודעות על המותג שלך, ודבר די מעניין, כי אתה יכול להבין בזמן אמת מי עושה מה. אני מכיר כמה מקרים מה-BBC, כאשר הם עקבו אחר רשתות חברתיות בזמן אמת באיזה שידור: הייתה תגובה כזו ואחרת, אנשים כותבים על זה, שואלים שאלה כזו ואחרת - וזה מעולה! אני חושב שזה ישמש בקרוב מאוד, כי זה מעניין את כולם.

דוגמנות עמדות מותג

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

הבא יש לי דוגמנות של עמדות מותג. קטע קטן וקצר כיצד ניתן לדרג מותגים באמצעות מדדים שונים (לא אהבות של מנויים ברשתות חברתיות, אלא שימוש במדדים מורכבים, עניין בתוכן, זמן קבלת מדדים).

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

יש לי דוגמה של "פארמה" מסיבה מסוימת. כאן העיגולים הקטנים הם פנימיים, בהירים – זו כמות תוכן הטקסט שהמותג עצמו יוצר, העיגול הגדול הוא כמות תוכן התמונות והווידאו שהמותג עצמו יוצר.

הקרבה למרכז מראה עד כמה התוכן מעניין את הקהל. יש דגם גדול, יש המון כל מיני פרמטרים: לייקים, פוסטים חוזרים, זמן תגובה, מי שיתף שם בממוצע... כאן אפשר לראות: יש "קגוסל" נפלא ששואב כמות עצומה של כסף ליצירת תוכן משלו, ובשל כך הם די קרובים למרכז. ויש חברים שגם יוצרים תוכן משלהם, אבל הקהל לא מתעניין בו. זו לא דוגמה מאוד מספקת, כי כל החשבונות האלה כמעט מתים.

יגור קריד אהוב יותר מבאסטה

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

לצערי, השאר... ממה להראות... ובכן, יש גם ראפרים רוסים, כאופציה, מחברות אמיתיות.

מה הפלוס? העובדה היא שחברה יכולה להכניס כמעט כל דבר למודל כזה, החל מהשכר הממוצע של מנויים שעובדים עבור המותג שלך; כל דגם שהם אוהבים. מכיוון שכל משרד פרסום מחשב את המדדים שלו בצורה שונה, מותגים מחשבים את המדדים שלהם בצורה שונה.

יש כאן גם אחד - באסטה, שמייצר כמות גדולה של תוכן, אבל ממוקם בפריפריה, כי התוכן הזה כנראה לא מאוד מעניין את הקהל. שוב, אני לא מתיימר לשפוט. אבל בכל זאת, יש את יגור קריד, שלפי הרשתות החברתיות הוא כמעט המבצע הכי טוב של זמננו, אבל מפרסם רק את התמונות האישיות שלו. עם זאת, יש לו מספר רב של מנויים: יש איפשהו בסביבות מיליון מהם. אני לא זוכר את המספר המדויק; אני זוכר שאחוז המעורבות של האנשים האלה גבוה בהרבה מ-85%, כלומר למיליון מנויים הוא מקבל 850 אלף תגובות מהאנשים האמיתיים האלה - זה טירוף אמיתי. זה נכון.

ארתור חצ'ויאן: "ביג דאטה אמיתי בפרסום"

תשובות לשאלות מהקהל:

כמה זמן לקח ליצור את מודל ניתוח הראפרים?

  • לכל אחד יש קהל יעד משלו, האינטרסים של האנשים האלה מחושבים לכל אחד... כל זה מנורמל למרחק למרכז בערך, המיקום הרדיאלי שלהם לא חשוב (זה פשוט נמרח פה בשביל היופי, כדי שהם יעשו זאת לא להיתקל אחד בשני). חשובה רק הקרבה המשוערת למרכז. זה הדגם שבו אנו משתמשים. לדוגמה, אני אוהב יותר את העיגול, יש אנשים שעושים אותו בראש כחצי עיגול.
  • המודל הזה הורכב במהירות, תוך שעתיים או שלוש (כן, אדם אחד). כאן הוכנסו רק מדדים: מה אנחנו מכפילים במה, מוסיפים את זה ואז איכשהו מנרמלים את זה. תלוי בדגם. יש אנשים שמתעניינים בשכר הממוצע (זו לא בדיחה) של המנויים שלהם. ובשביל זה אתה צריך למצוא את אנשי הקשר שלהם, אביטו, לחשב הכל, להכפיל את זה. קורה שלוקח לזה הרבה זמן לקחת בחשבון, אבל ספציפית זה (מצביע על השקף הקודם) - הפרמטרים כאן מאוד פשוטים: מנויים, פוסטים חוזרים וכו'. זה לקח כשעתיים עד שלוש שעות כדי להשלים. בהתאם לכך, הדבר הזה מתעדכן בזמן אמת, ואתה יכול להשתמש בו.

עכשיו מגיע החלק הכיפי. סיימתי עם דוגמאות, כי זה לא מעניין לדבר הרבה זמן לבד. ואני מקווה שעכשיו תשאלו שאלות, ולמעשה נעבור מנושא לנושא, כי יש לי דוגמאות כאלה כיצד ניתן להשתמש בטכנולוגיות וכן הלאה...

תשובות לשאלות מהקהל:

  • היה לי מקרה אישי אחד ויחיד עם אחד, כביכול, "קזינו ליד", כשהוצבה שם מצלמה, זוהו פרצופים וכו'. אחוז המוכרים בהחלט די גדול - גם שלנו וגם אצל המתחרים שלנו. אבל זה בעצם די מעניין. אני רואה בזה דבר מעניין: אפשר להבין מי האנשים האלה ולחזות די טוב למה בדיוק הם הגיעו לכאן, מה השתנה כל כך בחייהם שהם החליטו להגיע לקזינו. אבל לגבי סוגים ספציפיים של עסקים... אם אתה שם דבר כזה בבית מרקחת, אז אין טעם - אתה לא יכול לחזות מדוע אדם הגיע לבית המרקחת.

    המשימה הגלובלית כאן הייתה לבנות מודל כדי להבין מתי אדם פוטנציאלי רוצה להתעניין במותג שלך, כך שתוכל לתת לו פרסום לא אחרי שהוא קנה משהו (כמו שקורה עכשיו), אלא לתת לו פרסום " בתחזית" מתי כל זה יקרה. זה היה מעניין עם כזה "קזינו ליד"; התברר שיש אחוז די מעניין של האנשים האלה - למה: מישהו פתאום קיבל קידום, מישהו אחר קיבל משהו אחר - תובנות מעניינות כאלה. אבל עם כמה חנויות, עם קמעונאות, עם חנות של איזושהי כדורים, נראה לי שזה לא יהיה נכון במיוחד.

האם משתמשים ב-Big Data במצב לא מקוון?

  • זה היה במצב לא מקוון. אתה רק צריך להבין בדיוק, בערך, אם הדגם הזה יתאים או לא. שוב, עם מים מוגזים... אני בעצם מתעניין בהכל, אבל אני אישית לא מבין עד כמה, איך הפרופילים של האנשים האלה, ההתנהגות שלהם יכולה להיות תלויה מתי הם רוצים לקנות מים בבקבוק. למרות שזה אולי באמת נכון, אני לא יודע.

כמה חשבונות פתוחים ברשתות חברתיות יש?

  • יש לנו במיוחד 11 רשתות חברתיות - אלה הן "Vkontakte", "פייסבוק", "טוויטר", "Odnoklassniki", "אינסטגרם" וכמה דברים קטנים (אני יכול להסתכל ברשימה, כמו "Mail.ru" וכן הלאה) . ב-VKontakte בהחלט יש לנו עותק של כל החברים האלה. יש לנו אנשים ב-VKontakte - זה 430 מיליון מכל מי שהיה אי פעם (מתוכם כ-200 מיליון פעילים כל הזמן); יש קבוצות, יש קשרים בין האנשים האלה ויש תוכן שמעניין אותנו (טקסט), וחלק מהתקשורת, אבל מאוד קטן... בגדול, אנחנו מסתכלים על התמונה הזאת: אם יש שם פרצופים, אנחנו לשמור אותם, אם יש מם, אנחנו שומרים אותם אנחנו לא שומרים אותו, כי אפילו לנו לא היה מספיק כדי לשמור את תוכן המדיה.

    יש פייסבוק בשפה הרוסית. איפשהו עכשיו 60-80% הם Odnoklassniki, בעוד כמה חודשים כנראה נביא את כולם עד הסוף. אינסטגרם רוסי. לכל הרשתות החברתיות הללו יש קבוצות, אנשים, קשרים בינם לבין טקסט.

  • כ-400 מיליון איש. יש עדינות: יש אנשים שהעיר שלהם לא מצוינת (הם אולי רוסים / לא רוסים); מתוכם, הממוצע עבור רשתות חברתיות הוא 14% מהחשבונות הסגורים ב-VKontakte, אני לא יודע את הנתון המדויק בפייסבוק.
  • אנחנו גם לא שומרים מדיה באינסטגרם - רק אם יש שם פרצופים. איננו מאחסנים תוכן מדיה כזה (אחר). בדרך כלל מעניין: טקסט בלבד, קשרים בין אנשים; את כל. המחקר הנפוץ ביותר באינסטגרם הוא המחקר הרגיל על הקהל: מי האנשים האלה, והכי חשוב, הקשר של האנשים האלה עם רשתות חברתיות אחרות. מצא את הפרופיל של אדם זה ב-Vkontakte ובפייסבוק כדי לחשב את גילו וכן הלאה.
  • עדיין אין צורך לקחת על כולם - פשוט כי אין לקוחות. לגבי השפה: יש לנו רוסית, אנגלית, ספרדית, אבל עדיין זה משמש אך ורק עבור מותגים מרוסיה; ובכן, או החברות שמביאות אותם מרוסיה.
  • אנו מראיינים אנשים מדי יום בהרבה, הרבה, הרבה שרשורים: אנו אוספים נתונים על ידי איסוף האינטרנט, ומעדכנים את האינדיקטורים הללו באמצעות Api. תוך 2-3 ימים אתה יכול לעבור את כל "VKontakte", לעבור אותם; בעוד כשבוע תוכלו לעבור על כל הפייסבוק, להבין מי עדכן מה ומה לא. ואז להרכיב מחדש את האנשים האלה בנפרד: מה בדיוק השתנה, רשום את כל הסיפור הזה. לעתים רחוקות מאוד, מניסיוני, נעשה שימוש בפרופיל המדיה החברתי הישן של מישהו למטרה עסקית אמיתית כלשהי. זה היה הזמן שבו איש פוליטי אחד הגיש מועמדות, והמשימה שלו הייתה להבין איזה סוג של אנשים מגיעים למטה, מי האנשים האלה לפני 6-8 חודשים (האם הם מחקו את הפרופיל שלהם, אבל למעשה למועמד אחר, הגיעו פתקי הצבעה לְקַלְקֵל).

    וכמה פעמים - סיפורים אישיים כשתצלומים של מישהו פורסמו ברשות הרבים. היה צורך למצוא קשרים וכו'. למרבה הצער, חבל, אבל אנחנו לא יכולים להעיד בבית המשפט, כי מאגר המידע שלנו אינו נזיל מבחינה חוקית.

  • אחסון MongoDB הוא האהוב עליי.

רשתות חברתיות מנסות להילחם באיסוף נתונים

  • בדרך כלל אנו מעלים רק רשימה של חשבונות אלה למפרסמים, ואז הם משתמשים באחד הסטנדרטי... כלומר, ברשתות חברתיות, ב-VKontakte, אתה יכול לציין רשימה של האנשים האלה.

    אבל פייסבוק משתמשת בעוגיות שנרכשו. אנחנו בעצמנו לא עובדים עם עוגיות, אבל היו כמה סיפורים כשהמפרסם עצמו נתן כמה אנשים, עשינו איתם אינטראקציה - יש להם את הרשתות האלה, עם פרסום טיזר, לא טיזר, "עוגיות" האלה. אתה יכול לקשור את זה - אין שאלה! אבל אני לא ממש אוהב את החומר הזה כי אני לא חושב שזה מאוד אותנטי. זה לגמרי לדעתי, זה כמו TNS, ש"עוקב" אחר טלוויזיות - לא ברור אם אתה צופה בטלוויזיה הזו או לא, אם אתה שוטף כלים בזמן שהטלוויזיה שלך דולקת... וזה אותו דבר כאן : לעתים קרובות אני מחפש בגוגל משהו באינטרנט, אבל זה לא אומר שאני רוצה לקנות אותו.

  • אם אתה משתמש בסוג של רשת פרסום קונטקסטואלית סטנדרטית: היו לי כמה סיפורים כשפרקנו את האנשים האלה אליהם וניסינו, באמצעות הממשקים שלהם, לחבר אותם עם "עוגיות" באתרים שלהם. אבל אני לא ממש אוהב דברים כאלה.

נוסחה לחישוב השכר של משתמש אינטרנט

  • הנוסחה הכללית לשכר הממוצע: זה האזור שבו מתגורר אדם, זו קטגוריית העסקים בה הוא עובד (כלומר החברה שהיא המעסיק שלו), אז נלקח תפקידו בחברה זו, הממוצע שכר למשרה זו מוערך... שכר ממוצע שנלקח מ-"Head Hunter" ו-"Superjob" (ויש מספר מקורות נוספים) למשרה פנויה נתונה באזור נתון ולהקשר עסקי נתון.

    מ- "Avito" ו- "Avto.ru" נלקחים בדרך כלל פרמטרים נוספים אם אדם האיר את הטלפון. עם Avito אתה יכול לראות איזה סוג של דברים אדם מוכר - יקר, זול, משומש, לא בשימוש. עם "Avto.ru" אתה יכול לראות אם יש לו מכונית - הוא הבעלים שלה, הוא לא הבעלים שלה. זה מקום שבו פחות מ-20% מהאנשים שהפילו בטעות את הטלפון שלהם איפשהו, וניתן לקשר את החשבון שלהם לנתונים האלה.

באילו נפחים פועלת חברת איסוף הנתונים?

  • נפח התמונות המאוחסנות בפטה-בייט הוא 6,4. אני לא יכול להגיד בדיוק את קצב הצמיחה עכשיו, כי ב-2016 התחלנו להקליט "פריסקופים" ופשוט התחלנו להקליט וידאו.

    אני לא יכול להגיד בדיוק מתי זה היה אפס. עברנו מחברה לחברה - כל אלה סיפורים ארוכים. אבל אני יכול לומר ש-VK, פייסבוק, אינסטגרם וטוויטר - כל העסק הזה (אנשים, קבוצות וקשרים ביניהם) עם טקסט ותוכן - זה למעשה לא הרבה נתונים, לא סביר שאפילו פטה-בייט הספיק. אני חושב שזה 700 גיגה-בייט, כנראה 800.

האם אתה עוזר ללקוחות לקבוע את הנישה הנוכחית והיכן לחפור?

  • כשלקוח מגיע, אנחנו מציעים לו דברים כאלה, אבל אנחנו בעצמנו, כמו גוגל טרנדס, לא עושים דברים כאלה.
  • היו לנו כמה סיפורים כמעט סוציולוגיים, עם היסטוריה בחירות, לפני בחירות - ניתחנו הכל. עם מותגים והערכת דעות על מותגים, הכל כמעט תמיד מסכים. הנה סיפורי בחירות-בחירות - לא (עם הערכה איזה מועמד צריך לנצח). אני לא יודע מי טועה כאן - אנחנו, או אלה שחושבים ב-VTsIOM.
  • בדרך כלל אנחנו לוקחים את תוצאות הבקרה האלה מהמותג עצמו, הם לוקחים את זה מחברים שמזמינים מחקר - מחקר טלפוני, מחקר שיווקי וכו'. בנוסף, אפשר לבדוק את כל העניין הזה עם דברים בסיסיים: מישהו ענה לרשימת התפוצה, מישהו עשה סקרים... אם זה מותג גדול (קוקה קולה, למשל), יש לו בהחלט מיליון או שניים ביקורות פנימיות מלקוחות - אלה לא רק הערות ברשתות חברתיות וכמה דעות; אלו סוג של מערכות פנימיות, סקירות וכו'.

החוק לא "יודע" מהם נתונים אישיים!

  • אנו מנתחים אך ורק מקורות נתונים פתוחים ולעולם לא מתערבים בשום טריקים מלוכלכים. המודל שלנו בנוי על העובדה שאנו מאחסנים את כל הנתונים הפתוחים בכמה מרכזי נתונים ציבוריים, שוכרים אותם במקום אחר, ומנתחים אותם בבית, במשרדים שלנו, בשרתים שלנו, והם לא יוצאים לשום מקום מחוץ לטריטוריה.

    אבל החקיקה שלנו בתחום הנתונים הפתוחים מאוד מעורפלת.

    אין לנו הבנה ברורה של מה זה נתונים פתוחים, מהם נתונים אישיים - יש את החוק הפדרלי ה-152 הזה, אבל עדיין... איך הם נחשבים? עכשיו, אם יש לי את שמך ומספר הטלפון שלך במסד נתונים אחד, במסד נתונים אחר יש לי את מספר הטלפון שלך ואת הדואר האלקטרוני שלך, בשלישי יש לי, נגיד, את הדואר האלקטרוני שלך ואת המכונית שלך; כל זה נראה כנתונים לא אישיים. אם תחבר את כל זה יחד, נראה שלפי החוק זה יהפוך לנתונים אישיים.

    אנחנו עוקפים את זה בשתי דרכים. הראשון הוא התקנת שרת עם תוכנה עבור הלקוח, ואז הנתונים הללו אינם חורגים משטחו, ולאחר מכן הלקוח אחראי להפצת הנתונים האישיים הללו, נתונים שאינם אישיים וכו'. או האפשרות השנייה: אם זה סוג של סיפור שבו צריך לתבוע רשת חברתית או משהו אחר...

    היה לנו מחקר כזה כשאספנו (היו פריימריז של רוסיה המאוחדת) עבור Lifenews את החשבונות של החברים האלה ובדקנו איזה סוג של פורנו הם אוהבים. זה היה דבר מצחיק, אבל בכל זאת. אנו מוכרים זאת כדעתנו האישית, מבלי לחשוף באופן חוקי במסמכים את מה שניתחנו - מרשם המדינה המאוחדת של ישויות משפטיות, משכורות, רשתות חברתיות; אנחנו מוכרים חוות דעת של מומחים, ואז בצד אנחנו מסבירים לאדם מה ניתחנו ואיך.
    היו כמה סיפורים, אבל הם היו קשורים לכמה פרויקטים מסחריים ציבוריים. לדוגמה, יש לנו פרויקט חינם ללא מטרות רווח למי שרוכב על לונגבורד (לוחות כאלה הם ארוכים): המשימה הייתה לאסוף פרסומים של אנשים - כשמישהו מפרסם "הלכתי לפארק גורקי לסיבוב". ועכשיו הוא צריך להיכנס למפה, ואנשים סביבו יכולים לראות שמישהו בקרבתו. VK התחבט איתנו על הנושא הזה במשך זמן רב מאוד, כי הם לא אהבו את העובדה שאנחנו מפרסמים את המידע הזה ללא רשותם של אנשים. אבל אז העניין לא הגיע לבית המשפט, כי בתוך כמה קהילות גדולות הוספנו לכללים שהנתונים יכולים לשמש צדדים שלישיים, סוכנויות, חברות, ניתוחים וכו'. כמובן שזה לא היה אתי במיוחד, אבל עדיין.

  • פשוט הבנו את זה בזמן והתחלנו למכור את חוות דעת המומחים שלנו לכולם.

האם אתה עובד עם מוסדות חינוך?

  • אנחנו משתפים פעולה עם מוסדות חינוך, כן. יש לנו מגוון שלם: יש לנו תוכנית לתואר שני בבית הספר הגבוה, ואנחנו משתפים פעולה עם אוניברסיטאות אחרות. אנחנו מאוד אוהבים אוניברסיטאות!
  • אם יש לך את אנשי הקשר שלי, אתה יכול לכתוב לי. וקישור למצגת, אם מישהו מעוניין - כל הדוגמאות האלה יש, אפשר להעביר אותה.
  • אם אתה יודע את מספר הטלפון, דואר - זו אפשרות כמעט מאה אחוז, אף אחד לא יסיר את זה. אם אין מספר טלפון, זו בדרך כלל תמונה; אם אין תמונה, זו השנה, מקום המגורים, העבודה. כלומר, לפי שנה, מקום מגורים ועבודה, כמעט כל אחד תמיד יכול להיות מזוהה בצורה עדינה למדי. אבל זו, שוב, שאלה לגבי המשימה.

    יש לנו, למשל, לקוח שמוכר טלוויזיה באינטרנט. מישהו קנה מהם מנוי ל"משחקי הכס" האלה, והמשימה היא להשתמש ב-CRM שלהם כדי למצוא את האנשים האלה ברשתות החברתיות, ואז למצוא אנשים פוטנציאליים מאזור ההשפעה שלהם. אני רק מתכוון שיש להם, נגיד, שם פרטי, שם משפחה ומייל... ואז קשה מאוד לעשות משהו. ברוב המקרים, ניתן למצוא אנשים באמצעות דואר אלקטרוני.

  • בהתבסס על הרכב החברים שלנו, אנחנו בדרך כלל "משדכים" אנשים ברשתות החברתיות, אבל זה לא תמיד נכון. זה לא שזה לא תמיד נכון – זה לא תמיד עובד. ראשית, זה מצריך עבודה רבה, כי הפעולה הזו (התאמת אנשים) תצטרך להתבצע קודם כל עבור כל אחד מהחברים - כדי להבין אם הם הגיעו מרשתות חברתיות או לא. ואז - עובדה לא ידועה לכל אחד שב-VKontakte יש לנו את אותם חברים, בפייסבוק יש לנו חברים שונים. לא לכולם, אבל אצלי, למשל, זה ככה; וזה נכון גם לרוב האנשים.

כיצד נאספים הנתונים המלאים ביותר?

  • התקנת תוכנה ללקוח בצד שלו. מותקן עליהם שרת, אשר לוקח מאיתנו נתונים ציבוריים בלבד, ומעבד את הנתונים האישיים שלהם באופן פנימי. הסכם NDA מסתיים עם הלקוח. זה כמובן לא מאוד נכון שהם מעבירים את זה אלינו, אבל האחריות המשפטית מוטלת על הלקוח - ובכן, כלומר, התקנת תוכנה עבורו, או העברת נתונים אנונימיים. אבל זה היה נדיר מאוד, כי - אנונימיזציה נכונה או לא נכונה - ברוב המקרים התלות בין האנשים הללו אובדת.

מי קונה תוכנה לזיהוי פנים?

  • אנחנו בעצם הולכים לכאן כי התוכנה העיקרית שלנו שאנחנו מוכרים היא חיפוש פנים, ניתוח מתאם, ואנחנו מוכרים אותה לסוכנויות ממשלתיות. ולפני שנה וחצי החלטנו שנכניס את כל הסיפורים האלה לפרסום, לשיווק, לשוק הציבורי - כך נוצרה Social Data Hub, ישות משפטית מסחרית. ועכשיו אנחנו רק באים לכאן. אנחנו מסתובבים פה כבר שנה וחצי, מנסים להסביר לאנשים שאין צורך לתת לאנשים הורדות עם אזכור, שצריך לתת להם תשובות לשאלות, שאין צורך בטונאליות , וכולי. אז קשה לומר איפה...
  • (למי אתה מתכוון?) לכל החברים שצריכים לחפש מחבלים ופדופילים.
    אני יכול לומר מיד (זו תהיה השאלה הבאה): לפי הנתונים שלנו, אף מורה לא נכלא בגלל פרסום מחדש.
  • ב-VKontakte - 14%; בפייסבוק אין פרופיל סגור ככזה (יש רשימה סגורה של חברים וכן הלאה). והכי מעניין שכתבתי עכשיו הודעה - עכשיו יספרו ויגידו.

אל תפרסם משהו שתתבייש בו!

  • אל תפרסם שום דבר ברשתות חברתיות שיגרום לך להתבייש - אני אישית עוקב אחרי זה. למרות שהיו לי הרבה אישיים, כי אני מקללת בפייסבוק. ובכן, היה והיה מה לעשות... אל תפרסמו שום דבר שיהיה מביך! אם אתה הולך לעבוד איפשהו בלשכה הציבורית מאוחר יותר, כן, עדיף לא להגיב. אם אתה לא מתכוון לעשות את זה, בגדול, לאף אחד לא אכפת. אני רק יכול להבטיח לך שאף אחד לא קורא את ההתכתבויות האישיות שלך, וכל זה בונה את כל הסיפור הזה...

    כל שבוע, מישהו בהחלט בא אלי ואומר: "ובכן, התמונות של חבר שלי הודלפו לאיזה דף ציבורי אנונימי! עֶזרָה! אגב, לעולם אל תפרסם דבר בדפים ציבוריים אנונימיים.

  • אני לא יודע לגבי מערכות ניטור אחרות - בהחלט ניקח את זה בחשבון, שהאזכור של המותג היה שלילי, אלוהים יסלח לי... אבל אני יכול להגיד שכל מיני חברים קרובים למדינה מתעניינים רק באנשים שיש להם קהל של יותר מ-5, ודעת הקהל שלהם יכולה להשפיע על מישהו ואז להשפיע. מניסיוני, מעולם לא קרה שסוכנות משאבי אנוש שמזמינה מאיתנו הערכות פרופיל אמרה: "מי שאוהב את נבלני, אל תעסיק אף אחד!"

לגבי פרסום התוצאות. כמה אנשים מועסקים במחקר?

  • מתוך 10 חברות הפרסום המובילות, שבע מפרסמות כעת. קשה לומר: כשהתחלנו את זה לפני שנה וחצי... יש לנו כמה אנשים בכל תחום - יש כמה אנשים בבנקים, יש כמה אנשים ב-HR, יש כמה אנשים בפרסום. ועכשיו אנחנו חושבים למי יותר משתלם ללכת קודם, למי אנחנו צריכים להתחיל לעשות כמה ממשקים...
  • (בערך מספר האנשים לפי פלח שוק) לא יותר מ-25 איש, כי לא אנסנו אף אחד.
  • באופן כללי, באופן עקרוני, נעשה שימוש בטכנולוגיות אלו מהשוק, לדעתי, ביותר מ-50%. חלקם בקמפיינים פרסומיים, חלקם באיזה ניתוח פנימי. הייתי אומר ש-40 אחוז משתמשים בו בניתוח פנימי, 50-60 אחוז מוכרים אותו למותגי קצה. אבל זה כבר תלוי בחברות הפרסום עצמן. אתה מבין, יש אנשים שמדווחים רק בגלל הכסף שהוצא, הפרסום שהם הציבו, בעוד שאחרים כותבים על כמה אנשים הם הביאו, איזה סוג של קהל... הייתי אומר, אבל יכול להיות שאני טועה - אני לא יודע. לא באמת לדמיין איך כל החברים האלה עובדים. אני יודע רק בנתונים כמותיים.

כמה מודעות 🙂

תודה שנשארת איתנו. האם אתה אוהב את המאמרים שלנו? רוצים לראות עוד תוכן מעניין? תמכו בנו על ידי ביצוע הזמנה או המלצה לחברים, Cloud VPS למפתחים החל מ-$4.99, אנלוגי ייחודי של שרתים ברמת הכניסה, שהומצא על ידינו עבורכם: כל האמת על VPS (KVM) E5-2697 v3 (6 ליבות) 10GB DDR4 480GB SSD 1Gbps החל מ-$19 או איך לשתף שרת? (זמין עם RAID1 ו-RAID10, עד 24 ליבות ועד 40GB DDR4).

Dell R730xd זול פי 2 במרכז הנתונים Equinix Tier IV באמסטרדם? רק כאן 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV החל מ-$199 בהולנד! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - החל מ-$99! לקרוא על כיצד לבנות תשתיות קורפ. מחלקה עם שימוש בשרתי Dell R730xd E5-2650 v4 בשווי 9000 יורו עבור אגורה?

מקור: www.habr.com

הוספת תגובה