Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

14 m. kovo 2017 d. „Social Data Hub“ generalinis direktorius Arthuras Khachuyanas kalbėjo BBDO paskaitoje. Arthuras kalbėjo apie intelektualų stebėjimą, elgesio modelių kūrimą, nuotraukų ir vaizdo įrašų turinio atpažinimą, taip pat kitus socialinių duomenų centro įrankius ir tyrimus, kurie leidžia nukreipti auditorijas naudojant socialinius tinklus ir Big Data technologijas.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Artūras Khachuyanas (toliau – AH): - Sveiki! Sveiki visi! Mano vardas Arthur Khachuyan, aš vadovauju įmonei Social Data Hub, mes užsiimame įvairiomis įdomiomis intelektualiomis atvirų duomenų šaltinių, informacijos laukų analizėmis, atliekame įvairiausius įdomius tyrimus ir pan.

O šiandien kolegos iš BBDO grupės paprašė pakalbėti apie šiuolaikines technologijas, skirtas analizuoti didelius duomenis, didelius ir ne tokius didelius duomenis reklamai: kaip jie naudojami, parodykite įdomių pavyzdžių. Tikiuosi pakeliui užduosite klausimų, nes galiu nuobodžiauti ir neatskleisti esmės ir panašiai, tad nesidrovėkit.

Tiesą sakant, pagrindinės kryptys, kur buvo naudojami kokie nors „beveik didelių duomenų“ sprendimai“, visos yra aiškios – tai yra orientavimasis į auditoriją, analizė, kažkokių analitinių rinkodaros tyrimų atlikimas. Bet visada įdomu, kokių papildomų duomenų galima rasti, kokias papildomas reikšmes galima rasti pritaikius analizę.

Kodėl reklamai reikalingos technologijos?

Nuo ko pradėti? Akivaizdžiausias dalykas – reklama socialiniuose tinkluose. Šiandien ryte nuėmiau: kažkodėl VKontakte mano, kad turėčiau pamatyti būtent šią reklamą... Ar tai gerai, ar blogai, tai antras klausimas. Matome, kad aš tikrai priklausau šauktinių kategorijai:

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Pats pirmas ir įdomiausias dalykas, kurį galima priimti kaip technologinį sprendimą... Pirmas dalykas, kurį norėjau apsispręsti prieš pradedant – apibrėžti terminus: kas yra atvirieji duomenys ir kas yra didieji duomenys? Nes visi žmonės turi savo supratimą šiuo klausimu, ir aš nenoriu niekam primesti savo sąlygų, bet... Kad tik nebūtų neatitikimų.

Asmeniškai manau, kad atviri duomenys yra viskas, ką galiu pasiekti be jokio prisijungimo ar slaptažodžio. Tai yra atviras profilis socialiniuose tinkluose, tai yra paieškos rezultatai, tai yra atviri registrai ir t. failų saugyklos, tai kažkur petabaitas duomenų. Likusi dalis mano terminologijoje nėra dideli duomenys, bet kažkas panašaus.

Didelio tikslumo profiliavimas ir profiliavimas

Eikime eilės tvarka. Pats pirmas ir įdomiausias dalykas, kurį galite sugalvoti analizuodami atvirus duomenų šaltinius, yra labai tikslus profiliavimas ir profilių įvertinimas. Kas čia? Tai istorija, kurioje jūsų socialinio tinklo paskyra gali nuspėti ne tik, kas jūs esate, ne tik jūsų interesus.

Tačiau dabar, derindami įvairius šaltinius, galite suprasti, koks yra jūsų atlyginimo vidurkis, kiek kainuoja jūsų butas ir kur jis yra. Ir visi šie duomenys gali būti naudojami tiesiogine prasme iš turimų priemonių. Pavyzdžiui, jei pasiimi savo paskyrą socialiniame tinkle, pažiūrėk, tarkime, kur gyvenate, kur dirbate; suprasti, kokioje verslo dalyje dirba įmonė; atsisiųskite panašias laisvas darbo vietas iš HH ir „Superjob“, jei esate analitikas, vadovas ir pan.; pasižiūrėk kur gyveni (bazė, tarkim CIAN), suprask, kiek kainuoja būsto nuoma šioje vietoje, kiek kainuoja įsigyti būstą šioje vietoje, nuspėk apytiksliai kiek uždirbsi. Be to, naudodamiesi savo socialiniais tinklais galite suprasti, kiek keliaujate, kur esate ir koks lojalus darbdaviui.

Atitinkamai, iš tokio didžiulio skaičiaus metrikų galime padaryti viską, ką norime. Galime supažindinti jus su jus dominančiu produktu. Ar galite įsivaizduoti internetinę parduotuvę? Nueini ten – ši internetinė parduotuvė užfiksuoja tavo paskyrą socialiniame tinkle ir tau sako: „Maša, tu ką tik išsiskyrei su savo vaikinu, štai keletas tam tikrų produktų, skirtų tau“. Tai ne artimiausia ateitis...

Kaip nustatoma žmogaus geografinė padėtis?

Atsakymai į klausytojų klausimus:

  • Paprastai tiksli gyvenamoji vieta laikoma 80 % visų registracijų. Bet žmonėms, kurie niekur nesiregistruoja, yra keli variantai: arba registracija, arba geografinė vieta, arba tai yra įrašų ir publikacijų analizė visam laikotarpiui, kai žmogus ką nors rašė... Ir kažkur, pasirodys kažkas, pavyzdžiui, „noriu nusipirkti vežimėlį netoli Akademičeskajos“ arba „Neseniai čia ant sienos pamačiau bjaurius grafičius“. Tai reiškia, kad beveik 80% žmonių geografinę vietą, darbo vietą ir gyvenamąją vietą galima nustatyti naudojant duomenis ar metaduomenis, kuriuos galima surinkti iš socialinių tinklų.

    Tai vėlgi yra pranešimų analizė. Paprasčiausia prasme tai yra registracijų ir geografinių vietų analizė socialiniuose tinkluose, kurie neištrina jpeg metaduomenų (iš jų galite ką nors suprasti). Tačiau likusiems žmonėms tai dažniausiai yra tekstinės transliacijos: arba žmogus „šviečia“ savo buvimo vietą, kai rašo apie ką nors, arba „šviečia“ savo telefoną, kuriuo galite rasti dalį jo reklamos „Avito“ arba jo paskyroje „. Automobilis RU“. Remdamiesi šiais duomenimis, galite derinti (pvz., „Parduodu automobilį netoli Majakovskajos“) ir apytiksliai tai daryti.

  • Žmonės dažniausiai tai skelbia socialiniuose tinkluose. Mes dirbame tik su atviraisiais šaltiniais ir čia kalbame tik apie atviruosius šaltinius. Dažniausiai jie skelbia skelbimus, tai yra, šešiasdešimt procentų atvejų, dažniausia istorija, kai žmonės „parodė“ savo dabartinį mobiliojo telefono numerį, yra kažko pardavimo skelbimai. Arba į kažkokias grupes žmogus rašo („ten parduodu tą ar aną“), arba kur nors eina.

    Taip! Dažniausiai komentuoja: „Atsiliepk man arba atsiųskite SMS, paskambink mano numeriu. Taip labai dažnai nutinka žmonėms, kurie ką nors parduoda, ką nors perka socialiniuose tinkluose, su kuo nors bendrauja... Atitinkamai, naudodami šį numerį galite susieti su juo jo profilį CIAN, jei jis kada nors ką nors paskelbė, arba vėlgi Avito. Tai tiesiog patys populiariausi, geriausi šaltiniai, tai bus toliau – tai Avito, CIAN ir pan.

  • Tai reiškia internetinę parduotuvę. Toliau bus veido atpažinimo ir profilių derinimo technologija (apie tai kalbėsime). Grynai teoriškai tai gali būti taikoma neprisijungus veikiančiai parduotuvei. Ir apskritai mano didelė svajonė, kad pasirodžius gatvių baneriams, einant pro kamerą, ji „įstrigtų“ veidą. Tačiau šis atvejis bus draudžiamas įstatymu, nes tai yra privatumo pažeidimas. Tikiuosi, kad anksčiau ar vėliau tai įvyks.
  • Iš asmeninės patirties. Labai dažnai, kai žmogus tau ką nors rašo, tu operuoji kažkokius jo gyvenimo faktus, kurių, regis, neturėtum žinoti... Žmonės dažniausiai išsigąsta. Bet! Remiantis naujausia statistika, uždarytų paskyrų skaičius socialiniuose tinkluose sumažėjo 14 proc. Daugėja padirbinių, daugėja atidarytų sąskaitų – žmonės vis labiau juda atvirumo link. Manau, kad po 3-4 metų jie nustos taip stipriai reaguoti į tai, kad kažkas žino apie juos informaciją, kurios galbūt neturėtų žinoti. Bet iš tikrųjų tai labai lengva gauti pažvelgus į jo sieną.

Ką galima paimti iš atvirų šaltinių?

Yra apytikslis sąrašas dalykų, kuriuos galima suprasti gana patikimai iš atvirų šaltinių. Tiesą sakant, yra dar daugiau skirtingų metrikų; tai priklauso nuo tokio tyrimo užsakovo. Yra kokia nors personalo agentūra, kuri domisi, ar tu keikiesi socialiniuose tinkluose, ar kur nors viešojoje erdvėje. Kažkas domisi, ar jums patinka Navalno leidiniai, ar, atvirkščiai, „Vieningosios Rusijos“ leidiniai, ar koks nors pornografinis turinys – tokie dalykai nutinka gana dažnai.

Pagrindinės – šeimos vertybės, apytikslė buto, būsto kaina, automobilio paieška ir pan. Pagal tai žmonės gali būti skirstomi į socialines grupes. Tai Maskvos „Tinder“ vartotojai, kas jie yra (pagal „Facebook“ paskyrose rastas jų nuotraukas); pagal interesus jie skirstomi į įvairias socialines grupes:

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Jei artėjame prie reklamos, tai pamažu nutolome nuo standartinio reklamos taikymo, kai „VKontakte“ pasirenkate, kad jus domina 18 metų vyrai, užsiprenumeravę tam tikras grupes. Toliau turiu šią nuotrauką, dabar parodysiu:

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Esmė ta, kad dauguma dabartinių paslaugų, kurios iš esmės analizuoja žmones, kurie analizuoja socialinius tinklus, užsiima interesų analize... Pirmas dalykas, kuris ateina į galvą, yra išanalizuoti aukščiausias savo abonentų grupes. Galbūt kai kuriems tai tinka, bet aš asmeniškai manau, kad tai iš esmės neteisinga. Kodėl?

Jūsų patinkantys įvertinimai renkami ir analizuojami

Dabar paimkite telefonus, pažiūrėkite į savo populiariausias grupes – tikrai bus daugiau nei 50% grupių, apie kurias jau pamiršote, tai yra tam tikras turinys, kuris jums iš tikrųjų nėra svarbus. Jūs jo visai nevartojate, bet vis dėlto sistema jus stebės pagal juos: ar užsiprenumeravote receptus, kai kurias populiarias grupes. Tai yra, jūs pažeisite sistemą, kuri analizuoja jūsų profilį, ir jūsų interesai nebus pateisinami.

Judame toliau... Kas ten? Mes manome, ką daro kiti žmonės. Mūsų nuomone, adekvačiausias būdas įvertinti vartotojų interesus yra like. Pavyzdžiui, „VKontakte“ nėra kanalo „Patinka“ ir žmonės mano, kad niekas nežino, kas jiems patinka. Taip, dalis like’ų pristatomi Instagram’e, kažką matome feisbuke, bet didžioji dalis turinio tam tikrose grupėse to netransliuoja bendrame kanale, o žmonės gyvena ir galvoja, kad niekas nesužinos, kas jiems patinka.

Ir surinkę tam tikrą mus dominantį turinį, rinkdami šiuos įrašus, rinkdami šiuos „patinka“ paspaudimus, tada patikrinę šį asmenį naudodami šią duomenų bazę, galime labai tiksliai nustatyti, kas jis yra, koks jo likimas, kuo jis domisi. Padėkite jį tiksliai į tam tikrą socialinę grupę ir bendraukite su juo.

Automobilio pirkimas keičia elgesį

Turiu tokį pavyzdį. Iš karto padarysiu išlygą, kad mano pavyzdžiai yra beveik reklama ir beveik rinkodara, nes, žinote, dauguma atvejų yra saugomi NDA ir pan. Bet vis tiek bus daug įdomių dalykų. Taigi, istorija su šiais žmonėmis: tai vyrai, kurie automobilį įsigijo 2010–2015 m. Kaip pasikeitė jų socialinis elgesys internete, rodo spalva. Keitėsi merginų procentas tarp prenumeratorių, prenumeravau „berniukiškus“ viešus puslapius, radau nuolatinį seksualinį partnerį...

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Visa tai suskirstyta pagal automobilio markę ir žmonių skaičių. Iš čia galite padaryti daug įdomių išvadų apie žmonių elgesį ir kaip visa tai veikia. Galiu pasakyti, kad „Porsche Cayenne“ ir pasodintas „Priora“ pagal pritrauktos auditorijos skaičių yra beveik identiški. Šios auditorijos kokybė ir elgesys skiriasi, bet kiekybė – maždaug tokia pati. Iš čia galite padaryti išvadą, kokios tik norite, arčiau jūsų rinkos. Jei parduodate „Audi“, vadinate šūkį „Pirk Audi ir atsitrauk nuo savo tėvų! ir taip toliau.

Taip, tai juokingas pavyzdys, kad žmonių elgesys, pagrįstas like’ų analize, pagal tai, į kurią grupę jie pereina, kokį turinį analizuoja – su beveik 100% tikimybe tampa aišku, kas tu esi. Nes jei neturite prieigos prie tinklo srauto ir neskaitote asmeninių žinučių, mygtukai „patinka“ visada parodys, kas yra šis asmuo - nėščia moteris, mama, kariškis, policininkas. Ir jums, kaip žmogui, galinčiam reklamuotis, tai yra didelis smūgis.

Atsakymai į klausytojų klausimus:

  • Kiekviename stulpelyje nurodomas žmonių skaičius šiame automobilyje; kaip pasikeitė jų elgesio modeliai. Pažiūrėkite: žmonės, kurie nusipirko „Porsche Cayenne“ - apie 550 žmonių (geltona), merginų procentas tarp abonentų išaugo.
  • Pavyzdys – socialinių tinklų „Vkontakte“, „Facebook“, „Instagram“ vartotojai nuo 2010 iki 2015 m. Vienintelis patikslinimas: čia pasirinkti automobiliai, kuriuos naudojant tam tikrus įrankius galima atpažinti nuotraukose daugiau nei 80% tikslumu.
  • Per tam tikrą laiką jo automobilis (na, tai ne jo, tai paliekame socialiniams tinklams)... Per tam tikrą laiką žmogus buvo nuolat fotografuojamas su mašina, buvo su juo, publikacijos. buvo skirtingos, nuotraukos buvo iš skirtingų kampų ir pan. Tada bus nuotrauka, su kokiais automobiliais kurie žmonės fotografuojasi ir... Taip, tai antras klausimas – pasitikėjimas socialinių tinklų duomenimis.
  • Deja, kadangi mes tai iškėlėme, socialinės žiniasklaidos duomenys ne visada teisingi. Žmonės ne visada linkę skelbti savo informaciją. Asmeniškai aš atlikau tokį tyrimą: palyginau Maskvos universitetų absolventų skaičių su socialiniuose tinkluose užsiregistravusių žmonių skaičiumi. Socialiniuose tinkluose yra registruota vidutiniškai 60% daugiau žmonių - Maskvos valstybinio universiteto tam tikrais metais baigusių tam tikras specialybes - nei iš tikrųjų yra iš esmės. Taigi taip – ​​čia, žinoma, yra procentas klaidų, ir niekas to neslepia. Čia tiesiog remiamės tuos automobilius, kuriuos galima identifikuoti su didesne nei 80% tikimybe.

Modelio mokymo šaltinių sąrašas

Pateikiame pavyzdinį šaltinių, kuriais galima pasinaudoti, sąrašą, kuris naudojamas labai tiksliai nustatyti asmens socialinį profilį, kas jis yra.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Mes paimame profilį iš socialinių tinklų, iš CIAN - buto kaina yra apytikslė, "Head-Hunter", "Superjob" - tai vidutinis atlyginimas tam asmeniui. Tikiuosi, čia nėra Head Hunter atstovų, nes jie mano, kad nėra labai gerai iš jų imti šiuos duomenis. Tačiau tai yra vidutinis atlyginimas tam tikruose regionuose už tam tikros rūšies veiklą už laisvas darbo vietas.

„Avito“, „Avto.ru“: labai dažnai žmonės, kai jų telefonas užsidega, tikrai turi jį (daugeliu atvejų) bent ką nors „Avito“, „Avto.ru“, arba kitose keliose svetainėse, iš kurių galite suprasti, kas jie yra. Jei šiuo telefonu buvo parduotas vežimėlis ar automobilis... Rosstat ir vieningas valstybinis juridinių asmenų registras vis tiek yra daugiau registrų, kurių pagalba galima reitinguoti įdarbinančią įmonę – pagal kažkokią formulę, pagal modelį, kurį bet kuri asmuo gali nustatyti (galite apytiksliai nustatyti šio asmens pinigus ir pan.).

„Tinder“ padeda rinkti duomenis apie žmonių padėtį

Be to, yra toks įdomus dalykas (arba tai labai juokinga tyrime) - tai vėlgi duomenų rinkimas iš Maskvos „Tinder“, naudojant šio „Tinder“ robotus. Buvo nustatytas atstumas iki žmonių, o tada – apytikslė jų vieta.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Šio tyrimo tikslas buvo nustatyti Tinder sąskaitų skaičių valdžios institucijų teritorijoje – Dūmoje, prokuratūroje ir pan. Bet jūs, kaip reklamos užsakovas, galite įsivaizduoti ką tik norite: tai gali būti, pavyzdžiui, „Starbucks“ ar dar kas nors... Tai yra, kiek žmonių Tinderyje geria iš jūsų kavą, ką nors užsisako, yra parduotuvėse. Dėl šios geografinės vietos: tai galima padaryti naudojant bet kurią paslaugą.

Atsakymas į auditorijos klausimą:

  • Tinderis? Tu nežinai? „Tinder“ yra pažinčių programa, kurioje peržiūrite nuotraukas (kairėn-dešinėn), o ši programa rodo atstumą iki asmens. Jei atstumą iki šio asmens gaunate iš trijų skirtingų taškų, galite nustatyti vietą maždaug (+ 5-7 metrai). Šiuo atveju tai nėra taip sunku nustatyti prokuratūros ar Valstybės Dūmos teritorijoje. Bet vėlgi, tai gali būti jūsų parduotuvė, gali būti bet kas.

Pavyzdžiui, seniai seniai turėjome tokį atvejį (ne tyrimą), kai iš vieno iš korinio ryšio operatorių gavome duomenis apie srauto tankį, duomenis apie korinio ryšio taškų judėjimo tankį ir visa ši informacija buvo uždėta. greitkeliuose esančių reklaminių stendų koordinatėse . O korinio ryšio operatoriaus užduotis – apytiksliai nustatyti, kiek žmonių praeina ir gali pamatyti šią reklaminę reklamą.

Jei čia yra reklaminių skydų specialistai, galima sakyti: su super patikimumu neįmanoma suprasti - kažkas ateina, kažkas nežiūrėjo, kažkas pažiūrėjo... Nepaisant to, tai yra pavyzdys, kaip yra 20 mlrd. tai Maskvoje, kur tų žmonių tankumas kas valandą tam tikrais maršrutais... Matai, pro ką tie žmonės pravažiuodavo bet kurią akimirką ir apytiksliai įvertini keleivių srautą.

Atsakymas į auditorijos klausimą:

  • Tokių duomenų niekas neduoda. Tokį tyrimą atlikome vienam iš operatorių, tai išskirtinai vidinė istorija, todėl, deja, nepateikiama paveikslėlių pavidalu. Tačiau dažnai didelėms reklamos agentūroms nekyla problemų susisiekti su operatoriumi. Bent jau Maskvoje yra daug precedentų, kai, pavyzdžiui, draudimo bendrovės kreipiasi į tokias bendroves kaip „GetTaxi“, kurios pateikia beasmenius duomenis apie vairuotojo amžių, kaip vairuoja (gerai – blogai, neapgalvotai – ne), siekdamos nuspėti. politika ir pan. Visi su tuo kovoja, bet kažkokiu vidiniu lygmeniu pateikti anoniminius duomenis – manau, kad niekas neturi tokios problemos.

Vaizdo ir rašto atpažinimas

Pirmyn. Mano mėgstamiausias yra vaizdo atpažinimas. Bus nedidelis gabalas apie žmonių paiešką pagal veidus, bet dažniausiai šios dalies nedalyvaujame. Mes imamės specialiai vaizdo atpažinimo ir nustatymo, kas yra šiame paveikslėlyje – automobilio markę, spalvą ir pan.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Turiu tokį juokingą pavyzdį:

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Buvo toks tyrimas dėl tatuiruočių paieškos įvairiuose socialiniuose tinkluose. Atitinkamai tą patį galima pritaikyti bet kuriam prekės ženklui, bet kokiam vizualiniam įvaizdžiui, beveik bet kokiam vizualiniam įvaizdžiui. Yra tokių, kurių negalima patikimai nustatyti (jų nepriimame).

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Štai mano mėgstamiausia. Automobilių markės gana dažnai kreipiasi į šią užduotį, nes jų užduotis, pavyzdžiui, yra surasti visus kokio nors BMW X6 savininkus, suprasti, kas jie tokie, kaip jie tarpusavyje susiję, kuo domisi ir pan. Tai susiję su klausimu, su kokiais automobiliais žmonės fotografuojasi socialiniuose tinkluose.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Filtravimo čia visai nebuvo: objektas buvo jų, automobilis – ne jų; Tai tik automobilių gedimas - amžius ir pan. Tačiau vizualinio vaizdo atpažinimas naudojamas gana dažnai: tai nėščiųjų paieška, ir prekės ženklų logotipų paieška kokios nors žiniasklaidos priemonėse (kas ką skelbia).

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Mėgstamiausias dėklas (kurį naudoja įvairūs restoranai): kokie suktinukai skelbiami socialiniame tinkle. Tai juokinga, bet iš tikrųjų tai leidžia suprasti daug įdomių dalykų, pirmiausia apie savo klientus: kas atėjo pas jus ir kodėl jie tai padarė. Nes ne paslaptis, kad sušių baruose dauguma (nesakysiu „mergaitės“) fotografuojasi norėdami užsiregistruoti, ką nors nufotografuoti ir pan.

Prekės ženklas gali tuo pasinaudoti. Prekės ženklas domisi, kokių produktų reikia gražiai fotografuoti ir publikuoti, kokie žmonės ten atėjo. Tai galima padaryti su beveik bet kuo, pradedant maistu.

Vaizdo įrašo modelio atpažinimas

Atsakymas į auditorijos klausimą:

  • Ne vaizdo įraše. Turime jį bandomuoju režimu. Išbandėme šią technologiją, bet pasirodo, kad... Neblogai viską atpažįsta su video, bet niekur neradome jai pritaikymo. Ate. Neskaitant analizavimo, kiek ir kokie video tinklaraštininkai kažkur šneka... Buvo toks tyrimas. Kiek jų veidų susitinka, kaip dažnai. Tačiau prekės ženklai dar nesugalvojo, kur tai sugalvoti. Gal kada nors ateis.

Vėlgi, tai maistas, tai gali būti nėščios moterys, vyrai (ne nėščia), automobiliai – bet kas.

Kaip alternatyva, vienai žiniasklaidos priemonei buvo skirtas Naujųjų metų tyrimas. Taip pat toli nuo reklamos, bet vis tiek. Štai kokiu maistu žmonės pasninkaudavo Naujiesiems metams:

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Čia taip pat suskirstyta pagal amžių. Matosi tokia koreliacija, kad jaunimas dažniausiai užsisako maistą, suaugusieji dažniausiai gamina tradicinį stalą. Tai juokinga, bet įsivaizduodami tai kaip prekės ženklo savininką, galite įvertinti daugybę dalykų: kas ir kaip tvarko jūsų produktą, ką apie tai rašo. Dažnai tekste žmonės ne visada mini patį prekės ženklą, o tradicinės analitinės stebėjimo sistemos ne visada gali suprasti ir rasti šio prekės ženklo paminėjimo vien dėl to, kad jis nėra paminėtas tekste. Arba tekstas parašytas neteisingai, nėra maišos žymų ar nieko.

Nuotraukos matosi. Fotografuodami galite atskirti, ar tai yra centrinis kadro objektas, ar ne centrinis kadro objektas. Tada galite pamatyti, ką šis asmuo parašė. Tačiau dažniausiai jis naudojamas kaip potencialių auditorijų, važiavusių tam tikrais automobiliais ir pan., paieška. Ir tada su šiais automobiliais nuveiksime daug įdomių dalykų.

Botai mokomi mėgdžioti žmones

Taip pat buvo tokia galimybė naudoti žmonių skaičiavimą:

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Yra galimybė lyginti žmones, kai reikia surasti žmones naudojant kai kurias nuotraukas, suprasti jų socialinį profilį, kas jie yra. Vėlgi, grįžtame prie klausimo, kad jei turime fotoaparatą neprisijungusioje parduotuvėje, tai yra gana geras būdas suprasti, kas ateina pas jus, kas yra šie žmonės, kuo jie domisi, kas paskatino ateiti pas jus. .

Toliau seka įdomiausias dalykas: jei surinksime jų paskyras socialiniuose tinkluose, suprasime, kas tie žmonės, kuo jie domisi, galime (pasirinktinai) padaryti botą, panašų į šiuos žmones; šis botas pradės gyventi kaip šie žmonės ir analizuos, kokias reklamas mato įvairiuose socialiniuose tinkluose. Tai leis jums tiksliai suprasti, kurie prekės ženklai yra skirti šiam asmeniui. Tai taip pat gana dažna istorija, kai reikia ne tik išanalizuoti, kas yra šis žmogus ir kokių pomėgių jis turi, bet ir į kokią reklamą turėtų orientuotis potencialūs konkurentai ar kiti suinteresuoti asmenys.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Ryšių socialiniuose tinkluose analizė

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Kitas įdomus dalykas – santykių tarp žmonių analizė. Tiesą sakant, jungčių tinkle analizė, šie tinklo grafikai - čia nėra šiek tiek, nieko naujo, visi tai žino.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Tačiau taikymas reklamos užduotims yra įdomiausias. Tai žmonių, kurie nustato tendencijas, paieška, tai žmonių, kurie skleidžia informaciją pagal tam tikrus kriterijus šiame tinkle, paieška. Tarkime, mus domina tie patys tam tikro BMW modelio savininkai. Sujungę juos visus, galime rasti tuos, kurie kontroliuoja viešąją nuomonę. Tai nebūtinai automobilių tinklaraštininkai ir pan. Paprastai tai yra paprasti bendražygiai, kurie sėdi įvairiuose viešuose puslapiuose, domisi tam tikru turiniu ir gali per labai trumpą laiką pritraukti jūsų prekės ženklą ar jus dominantį asmenį į šią atsakomybės sritį, į palūkanų.

Čia yra toks pavyzdys. Turime keletą potencialių žmonių, ryšių tarp žmonių. Čia oranžiniai – žmonės, maži taškeliai – bendros grupės, bendri draugai.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Surinkus visus šiuos ryšius tarp jų, labai aiškiai matyti, kad yra žmonių, kurie turi daug bendrų grupių, bendrų draugų, jie ten yra tarp savęs... Ir jei šita pati vizualizacija suskirstyta į grupes pagal interesus, pagal turinį, kurį platina, kiek tarpusavyje bendrauja... Čia matosi, kad ankstesnė nuotrauka tapo tokia:

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Čia grupės aiškiai išsiskiria spalva. Šiuo atveju tai yra mūsų aukštosios ekonomikos mokyklos magistrantai. Čia matote, kad violetinės / mėlynos spalvos yra tie, kurie mėgsta Transparency International, Open Russia ir Chodorkovskio viešuosius puslapius. Apačioje kairėje yra žaliosios, mylinčios Vieningą Rusiją.

Matote, kad ankstesnis paveikslas buvo toks (tai tik ryšiai tarp žmonių), bet tapo aiškiai atskirtas. Tai yra, visi žmonės visada yra susiję vienas su kitu, jie turi tuos pačius interesus, yra draugai vienas su kitu. Yra vieni viršuje, kiti apačioje, o ten dar keli bendražygiai. Ir jei kiekvienas iš šių mažų pografų atskirai vizualizuojamas su kitais parametrais ir žiūri į turinio sklaidos greitį (grubiai tariant, kas ten ką perrašo), kiekvienoje dalyje galite rasti vieną ar du žmones, kurie visada laiko viešąją nuomonę savo rankose, bendraudami su kuriais, prašydami atsiųsti kokį nors įrašą ar dar ką nors - galite gauti atsakymą iš visos šios įdomios auditorijos.

Turiu dar vieną tokį pavyzdį. Taip pat grafikas: tai socialiniuose tinkluose kaip pavyzdys rasti BBDO grupės darbuotojai. Atrodo neįdomiai, didelis, žalias, ryšiai tarp jų...

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Bet aš turiu variantą, kai grupės jau sudaromos tarp jų. Tada, jei kam įdomu, yra interaktyvi versija – galima paspausti ir pasižiūrėti.

Viršuje dešinėje yra tie, kurie myli Putiną. Čia violetinės yra dizaineriai; tiems, kurie domisi dizainu, kažkuo įdomaus ir pan. Čia balti dalykai yra vadovų komanda (matyt, kaip suprantu); Tai žmonės, kurie apskritai nėra niekaip susiję, bet dirba maždaug tokias pačias pareigas. Likusi dalis yra jų bendros grupės, ryšiai ir pan.

Prekiniams ženklams reikia ne tinklaraštininkų, o nuomonės formuotojų

Mes paimame šiuos žmones ir juos surandame – tada reklamos agentūra, reklamos kompanija pati nusprendžia: gali duoti pinigų tam žmogui, kad jis kažkaip sąveikautų su šiuo turiniu, dar kažkuo, arba nukreiptų jiems savo konkrečią reklamos kampaniją. Tai taip pat gana dažnai naudojama, ypač dabar, nes visi prekės ženklai nori dirbti su tinklaraštininkais, nori, kad jų turinys būtų reklamuojamas, bet reklamos agentūros nelabai nori susisiekti (na, taip būna).

Ir tikroji išeitis iš šios situacijos yra rasti žmonių, kurie nėra tinklaraštininkai, ne grožio tinklaraštininkai, o, pavyzdžiui, kažkokios tikros būtybės, kurios bendrauja su šiuo prekės ženklu, kurios gali rašyti kokiame nors apgailėtiname viešame puslapyje „Mail.ru Answers“, gauti. tam tikras peržiūrų skaičius. Šie žmonės, kurie nuolat domisi šio asmens turiniu, paskleis visą reikalą, o prekės ženklas įsitrauks.

Antrasis tokios technologijos panaudojimo variantas dabar gana aktualus – botų paieška, mano mėgstamiausia. Tai yra rizika jūsų konkurentų reputacijai ir galimybė pašalinti nereikšmingus žmones iš reklamos kampanijos ir bet ko kito (komentarų trynimo ir ryšių tarp žmonių paieškos). Turiu tokį pavyzdį, jis irgi didelis ir interaktyvus – galima perkelti. Tai yra žmonių, rašiusių komentarus Lentacho bendruomenėje, ryšiai.

Šis pavyzdys skirtas tam, kad suprastumėte, kaip gerai ir lengvai matomi robotai; ir tam nereikia turėti jokių techninių žinių. Tai reiškia, kad „Lentachas“ paskelbė įrašą apie FBK tyrimą dėl Dmitrijaus Medvedevo, o kai kurie žmonės pradėjo rašyti komentarus. Surinkome visus komentarus rašiusius žmones – šie žmonės yra žali. Dabar perkelsiu:

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Žmonės yra tie žalieji (kas rašė komentarus). Jie čia, jie čia. Mėlyni taškai tarp jų yra jų bendros grupės, geltoni taškai yra jų bendri abonentai, draugai ir pan. Didžioji dalis žmonių yra susiję vienas su kitu. Nes, kad ir kokia būtų trijų, keturių, penkių rankos paspaudimų teorija, visi žmonės socialiniuose tinkluose yra tarpusavyje susiję. Nėra žmonių, kurie būtų atskirti vienas nuo kito. Netgi mano socialiai fobiški draugai, kurie VKontakte naudoja tik vaizdo įrašams žiūrėti, vis dar užsiprenumeruoja tuos pačius viešuosius puslapius kaip ir mes.

Navalnas taip pat naudoja robotus. Visi turi robotus

Didžioji dalis žmonių (čia yra, čia) yra susiję vienas su kitu. Tačiau yra tokia maža bendražygių grupė, kuri yra išskirtinai vieni su kitais draugais. Štai jie, mažieji žalieji, čia jų bendri draugai ir grupės. Čia jie net nukrito atskirai:

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Ir per laimingą atsitiktinumą būtent šie žmonės po šiuo įrašu parašė: „Navalnas neturi įrodymų“ ir panašiai, rašė tuos pačius komentarus. Žinoma, nedrįstu daryti išvadų. Bet vis dėlto turėjau dar vieną įrašą feisbuke, kai vyko diskusijos tarp Lebedevo ir Navalno, taip pat analizavau komentarus: paaiškėjo, kad visi žmonės, kurie parašė „Lebedevas yra šūdas“, jie nebuvo socialiniame tinkle. tinkluose neseniai keturis mėnesius, neužsiprenumeravęs nė vieno viešo puslapio, staiga nuėjo į šį konkretų įrašą, parašė būtent šį komentarą ir išėjo. Vėlgi, iš čia išvadų daryti neįmanoma, bet kažkas iš Navalno komandos man parašė komentarą, kad jie nenaudoja botų. Na, gerai!

Arčiau reklamos, arčiau prekės ženklo. Dabar visi turi robotus! Mes jas turime, mūsų konkurentai turi ir kiti. Jie turi būti išmesti arba palikti gerai gyventi; Remdamiesi tokiais duomenimis (rodo į ankstesnę skaidrę), patobulinkite juos taip, kad jie atrodytų kaip tikri žmonės, ir tik tada naudokite juos. Nors naudoti robotus yra blogai! Nepaisant to, gana dažna istorija...

Automatiniu režimu toks dalykas leidžia iš jūsų analizės išfiltruoti žmones, kurie nėra svarbūs analizei, žmonės, kurie neturėtų būti įtraukti į atranką, neturėtų būti įtraukti į šį tyrimą. Labai dažnai naudojamas. Vėlgi, ne visi automobilių savininkai iš tikrųjų turi automobilius. Kartais žmonės domisi tik žmonėmis, kurie potencialiai turi automobilį, kurie sėdi į kažkokias grupes, su kuo nors bendrauja, jie ten turi tam tikrą auditoriją.

Faktų ir nuomonių analizė

Kitas, kurį turiu, taip pat yra mano mėgstamiausias. Tai faktų ir nuomonių analizė.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Šiais laikais visi žino, kaip įvairiuose šaltiniuose paminėti savo prekės ženklą. Čia nėra jokios paslapties. O skaičiuoti tonalumą, atrodo, moka visi... Nors asmeniškai aš manau, kad pati tonacijos metrika nėra labai įdomi, nes kai ateini ir sakai klientui: „Žmogau, pas tave 37% neutralus“, o jis taip ir sako. , " Oho! Saunus!" Todėl būtų įdomiau pereiti šiek tiek toliau: nuo nuotaikų vertinimo iki nuomonių, ką jie sako apie jūsų produktą, įvertinimo.

Ir tai taip pat labai įdomus dalykas, nes... Aš asmeniškai tikiu, kad iš principo negali būti neutralių žinučių, nes jei žmogus ką nors rašo viešojoje erdvėje, tai ši žinutė kažkaip nuspalvinama. Aš asmeniškai niekada nemačiau neutralios žinutės, kurioje būtų minimas prekės ženklas. Paprastai tai yra kažkoks purvas.

Jeigu paimtume labai daug šių žinučių (gali būti milijonai, 10 mln.), iš kiekvienos žinutės išryškintume pagrindinę mintį, jas derintume, tai gana patikimai suprastume, ką žmonės kalba apie šį prekės ženklą, ką galvoja. „Man nepatinka pakuotė“, „Man nepatinka konsistencija“ ir pan.

Ką žmonės mano apie Transaero, Chupą Chupsą ir JAV prezidentą?

Turiu juokingą pavyzdį: tai infografika apie tai, ką socialinių tinklų vartotojai darytų su „Transaero“ įmone po jos bankroto.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Там есть много интересных примеров: сжечь, убить, выслать в Европу, были даже 2%, которые написали – «Отправить их в Сирию на военные действия». Двигаясь от смешной штуки, это может быть любой бренд практически – начиная от моих любимых собачьих кормов, заканчивая какими-нибудь автомобилями. Кому не нравится упаковка, кому не нравятся реальные вещи – с этим всегда можно работать, с этим всегда можно считаться. Есть большое количество примеров, когда люди чуть ли не производство своей продукции меняли, потому что в соцсетях писали, что чупа-чупс недостаточно круглый или он недостаточно сладкий.

Yra dar vienas juokingas pavyzdys. Spėkite, kokie komentarai ir apie ką?

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Kažkodėl dabar nuomonių analizė, faktų, išgautų iš žinučių, analizė nėra labai naudojama ir nėra labai paplitusi. Nors ši technologija nėra itin slapta, praktiškai jokios know-how joje nėra, nes iš žmonių komentarų subjekto, predikato ištraukimas ir jų sugrupavimas nereikalauja genijaus kompiuterinės lingvistikos. Tai padaryti nėra taip sunku. Bet tikiuosi, kad per artimiausius porą metų žmonės pradės tai naudoti, nes... Bus šaunu – toks automatinis grįžtamasis ryšys! Jūs visada žinote, ką jie sako apie jus. Na, jūs suprantate, kad tai buvo padaryta apie JAV prezidentą.

Atsakymas į auditorijos klausimą:

  • Taip, tai „Facebook“ anglų kalba. Čia jie išversti į rusų kalbą. Tai kažkur buvo parašyta.

Didieji duomenys ir politinės technologijos

Tiesą sakant, turiu daug įvairių įdomių politikos pavyzdžių apie Trumpą ir visus kitus, bet nusprendėme jų čia nekelti. Tačiau yra vienas politinis pavyzdys.

Tai rinkimai į Valstybės Dūmą. Kada buvai? Praeitais metais? Beveik prieš pusantrų metų.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Štai žmonės, kurie sugebėjo nustatyti tikslią savo vietą iki tam tikro geografinio taško, kad suprastų, į kurią rinkimų apygardą jie pateko. Ir tada iš šių žmonių buvo paimti tik tie, kurie išreiškė savo neabejotiną nuomonę, už kuriuos balsuos.

Politinių technologijų požiūriu tai nėra labai teisinga, nes visą šitą reikalą reikia normalizuoti pagal gyventojų tankumą ir pan. Nepaisant to, mėlynieji čia balsuos už žinai ką, raudonieji balsuos už opozicijos bendražygius, kurių, beje, nebuvo daug.

Asmeniškai tikiu, kad „Big Data“ greitai nepasieks politinių technologijų, tačiau, kaip variantas, kandidatas yra ir prekės ženklas. Ir tai taip pat tam tikru mastu yra faktų ir nuomonių apie jūsų prekės ženklą analizė ir gana įdomus dalykas, nes galite realiu laiku suprasti, kas ką daro. Žinau kelis atvejus iš BBC, kai vienoje laidoje jie realiu laiku stebėjo socialinius tinklus: buvo toks ir toks atsakymas, žmonės apie tai rašo, užduoda tokį ir tokį klausimą - ir tai puiku! Manau, kad jis bus panaudotas labai greitai, nes visiems įdomu.

Prekių ženklų pozicijų modeliavimas

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Toliau turiu prekės ženklo pozicijų modeliavimą. Nedidelis trumpas gabalas apie tai, kaip galite reitinguoti prekės ženklus naudodami įvairias metrikas (ne prenumeratorių simpatijas socialiniuose tinkluose, o naudojant sudėtingas metrikas, susidomėjimą turiniu, laiką, praleistą gaunant metriką).

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Dėl tam tikros priežasties turiu „farmacijos“ pavyzdį. Čia maži apskritimai yra vidiniai, ryškūs – tai yra tekstinio turinio kiekis, kurį sukuria pats prekės ženklas, didelis apskritimas yra nuotraukų ir vaizdo įrašų kiekis, kurį sukuria pats prekės ženklas.

Atstumas iki centro parodo, koks turinys yra įdomus auditorijai. Yra didelis modelis, yra aibė visokių parametrų: like, repost, atsakymo laikas, kas ten vidutiniškai dalinosi... Čia matosi: yra nuostabus „Kagotsel“, kuris pumpuoja didžiulį kiekį pinigų savo turiniui kurti, ir dėl to jie yra gana arti centro. Ir yra bendražygių, kurie taip pat kuria savo turinį, bet publikai tai neįdomu. Tai nėra labai tinkamas pavyzdys, nes visos šios sąskaitos praktiškai negyvos.

Jegoras Creedas yra mylimas labiau nei Basta

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Deja, likusieji... nuo ką parodyti... Na, yra ir rusų reperių, kaip pasirinktis, iš tikrų kompanijų.

Koks pliusas? Faktas yra tas, kad įmonė į tokį modelį gali įdėti beveik bet ką, pradedant nuo vidutinio abonentų, dirbančių jūsų prekės ženkle, atlyginimo; bet kokį jiems patinkantį modelį. Kadangi kiekviena reklamos agentūra savo rodiklius skaičiuoja skirtingai, prekės ženklai savo rodiklius skaičiuoja skirtingai.

Čia taip pat yra vienas - Basta, kuri generuoja didelį kiekį turinio, bet yra periferijoje, nes šis turinys, matyt, nėra labai įdomus auditorijai. Vėlgi, aš nesiimu teisti. Tačiau vis dėlto yra Jegoras Creedas, kuris, anot socialinių tinklų, yra kone geriausias mūsų laikų atlikėjas, tačiau publikuoja tik savo asmenines nuotraukas. Nepaisant to, jis turi daug abonentų: jų yra apie milijoną. Tikslaus skaičiaus nepamenu; Prisimenu, kad šių žmonių įsitraukimo procentas yra daug didesnis nei 85%, tai yra, vienam milijonui abonentų jis gauna 850 tūkstančių atsakymų iš šių tikrų žmonių - tai tikra beprotybė. Tai yra tiesa.

Arthuras Khachuyanas: „Tikri dideli reklamos duomenys“

Atsakymai į klausytojų klausimus:

Kiek laiko užtruko reperio analizės modelio sukūrimas?

  • Kiekvienas turi savo tikslinę auditoriją, kiekvienam skaičiuojami šių žmonių interesai... Visa tai normalizuojama iki atstumo iki centro apytiksliai, radialinė jų padėtis nesvarbi (tiesiog čia ištepta dėl grožio, kad ir padarytų nesusidurti). Svarbu tik apytikslis artumas iki centro. Tai yra mūsų naudojamas modelis. Pavyzdžiui, man labiau patinka apskritimas, kai kurie žmonės tai daro mintyse kaip puslankį.
  • Šis modelis buvo sudarytas greitai, per dvi ar tris valandas (taip, vienas asmuo). Čia buvo įdėta tik metrika: ką padauginame iš ko, sumuojame, o tada kažkaip normalizuojame. Priklauso nuo modelio. Yra žmonių, kurie domisi savo abonentų vidutiniu atlyginimu (tai ne juokas). O tam reikia susirasti jų kontaktus, Avito, viską suskaičiuoti, padauginti. Būna, kad į tai reikia atsižvelgti, bet konkrečiai į tai (nurodo į ankstesnę skaidrę) – čia parametrai labai paprasti: prenumeratoriai, pakartotiniai įrašai ir pan. Tai užtruko apie dvi tris valandas. Atitinkamai, šis dalykas atnaujinamas realiuoju laiku, ir jūs galite jį naudoti.

Dabar ateina linksmoji dalis. Baigiau su pavyzdžiais, nes vienam ilgai kalbėti neįdomu. Ir tikiuosi, kad dabar jūs užduosite klausimus, o mes, tiesą sakant, judėsime nuo temos prie temos, nes turiu tokių pavyzdžių, kaip galima panaudoti technologijas ir pan...

Atsakymai į klausytojų klausimus:

  • Turėjau vieną ir vienintelį asmeninį atvejį su vienu, galima sakyti, „near-kazino“, kai ten buvo padėtas fotoaparatas, atpažįstami veidai ir pan. Atpažintų žmonių procentas tikrai nemažas – ir mūsų, ir konkurentų. Bet iš tikrųjų tai gana įdomu. Aš tai matau kaip įdomų dalyką: galite suprasti, kas tie žmonės, ir gana gerai nuspėti, kodėl būtent jie čia atėjo, kas jų gyvenime taip pasikeitė, kad jie nusprendė ateiti į kazino. Bet kalbant apie konkrečias verslo rūšis... Jeigu tokį daiktą dedate į vaistinę, tai nėra prasmės – negalite nuspėti, kodėl žmogus atėjo į vaistinę.

    Visuotinė užduotis čia buvo sukurti modelį, kad suprastumėte, kada žmogus potencialiai nori domėtis jūsų prekės ženklu, kad galėtumėte jam reklamuotis ne po to, kai jis ką nors nusipirko (kaip vyksta dabar), o reklamuoti. prognozėje“, kada visa tai įvyks. Buvo įdomu su tokiu „near-kazino“; pasirodė gana įdomus procentas šių žmonių - kodėl: kažkas staiga gavo paaukštinimą, kažkas gavo dar ką nors - tokios įdomios įžvalgos. Bet su kai kuriomis parduotuvėmis, su mažmenine prekyba, su kažkokių tablečių parduotuve, man atrodo, tai nebus labai teisinga.

Ar dideli duomenys naudojami neprisijungus?

  • Tai buvo neprisijungus. Tik reikia tiksliai, apytiksliai suprasti, tiks šis modelis, ar ne. Vėlgi, su gazuotu vandeniu... Man iš tikrųjų viskas įdomu, bet aš asmeniškai nesuprantu, kiek, kaip gali priklausyti šių žmonių profiliai, jų elgesys nuo to, kada jie nori nusipirkti vandens buteliuose. Nors tai tikrai gali būti tiesa, aš nežinau.

Kiek yra atvirų socialinių tinklų paskyrų?

  • Mes konkrečiai turime 11 socialinių tinklų - tai „Vkontakte“, „Facebook“, „Twitter“, „Odnoklassniki“, „Instagram“ ir kai kurios smulkmenos (galiu peržiūrėti sąrašą, pvz., „Mail.ru“ ir pan.) . „VKontakte“ tikrai turime visų šių bendražygių kopijas. „VKontakte“ turime žmonių – tai 430 milijonų visų, kurie kada nors egzistavo (iš kurių apie 200 milijonų yra nuolat aktyvūs); yra grupės, yra ryšiai tarp šių žmonių ir yra mus dominantis turinys (tekstas), ir dalis žiniasklaidos, bet labai maža... Grubiai tariant, žiūrime į šį paveikslą: jei ten yra veidai, mes Išsaugokite juos, jei yra memas, mes juos išsaugome Neišsaugome, nes net ir mums neužtektų išsaugoti medijos turinį.

    Yra „Facebook“ rusų kalba. Kažkur dabar 60-80% yra Odnoklassniki, po poros mėnesių turbūt sulauksime iki galo. Rusų Instagram. Visuose šiuose socialiniuose tinkluose yra grupės, žmonės, ryšiai tarp jų ir teksto.

  • Apie 400 milijonų žmonių. Yra subtilumų: yra žmonių, kurių miestas nenurodytas (jie gali būti rusai / ne rusai); Iš jų socialinių tinklų vidurkis yra 14% uždarytų paskyrų „VKontakte“, tikslaus skaičiaus „Facebook“ nežinau.
  • Mes taip pat nesaugome žiniasklaidos „Instagram“ - tik jei ten yra veidai. Tokio (kito) žiniasklaidos turinio nesaugome. Paprastai įdomu: tik tekstas, ryšiai tarp žmonių; Visi. Dažniausias tyrimas „Instagram“ yra įprastas auditorijos tyrimas: kas tie žmonės, ir, svarbiausia, šių žmonių ryšys su kitais socialiniais tinklais. Raskite šio asmens profilį „Vkontakte“ ir „Facebook“, kad galėtumėte apskaičiuoti jo amžių ir pan.
  • Visų kitų prisiimti kol kas nereikia – vien dėl to, kad nėra klientų. Kalbant apie kalbą: turime rusų, anglų, ispanų, bet vis tiek tai naudojama tik Rusijos prekių ženklams; na, arba įmonės, kurios juos atsiveža iš Rusijos.
  • Kiekvieną dieną apklausiame žmones daugybe, daug, daug gijų: renkame duomenis rinkdami žiniatinklį ir atnaujiname šiuos rodiklius naudodami Api. Per 2–3 dienas galite pereiti per visą „VKontakte“; Maždaug per savaitę galite pereiti visą „Facebook“ ir suprasti, kas ką atnaujino, o kas ne. Ir tada suburkite šiuos žmones atskirai: kas tiksliai pasikeitė, užrašykite visą šią istoriją. Mano patirtis rodo, kad labai retai kieno nors senas socialinės žiniasklaidos profilis buvo naudojamas kokiam nors realiam verslo tikslui. Tai buvo laikas, kai kreipėsi vienas politinis veikėjas, kurio užduotis buvo suprasti, kokie žmonės ateina į būstinę, kas tie žmonės buvo prieš 6-8 mėnesius (ar ištrynė savo anketą, bet iš tikrųjų kitam kandidatui atkeliavo biuleteniai sugadinti).

    Ir porą kartų - asmeninės istorijos, kai kažkieno nuotraukos buvo paskelbtos viešai. Reikėjo ieškoti sąsajų ir pan. Deja, gaila, bet liudyti teisme negalime, nes mūsų duomenų bazė juridiškai nelikvidi.

  • „MongoDB“ saugykla yra mano mėgstamiausia.

Socialiniai tinklai bando kovoti su duomenų rinkimu

  • Dažniausiai reklamuotojams įkeliame tik šių paskyrų sąrašą, o tada jie naudoja standartinį... Tai yra, socialiniuose tinkluose, VKontakte, galite nurodyti šių žmonių sąrašą.

    Tačiau „Facebook“ naudoja įsigytus slapukus. Mes patys nedirbame su slapukais, bet buvo keletas istorijų, kai reklamuotojas pats davė kai kuriems žmonėms, mes su jais bendravome - jie turi tokius tinklus, su anonsine, ne anonsine reklama, šiais „slapukais“. Galite susieti – jokių klausimų! Bet man tai nelabai patinka, nes nemanau, kad tai labai autentiška. Tai grynai mano nuomone, tai kaip TNS, kuris "seka" televizorius - neaišku, ar tu žiūri šitą televizorių, ar tu plausi indus, kol tavo televizorius įjungtas... Ir čia tas pats. : Labai dažnai ką nors paieškoju internete, bet tai nereiškia, kad noriu pirkti.

  • Jei naudojate kokį nors standartinį kontekstinės reklamos tinklą: turėjau keletą istorijų, kai išsiuntėme jiems šiuos žmones ir naudodamiesi jų sąsajomis bandėme juos sujungti su „slapukais“ jų svetainėse. Bet man tokie dalykai nelabai patinka.

Interneto vartotojo atlyginimo apskaičiavimo formulė

  • Bendra vidutinio atlyginimo formulė: tai yra regionas, kuriame žmogus gyvena, tai yra verslo, kuriame jis dirba, kategorija (ty įmonė, kuri yra jo darbdavys), tada užimama jo pozicija šioje įmonėje, vidutinis atlyginimas už šias pareigas yra apskaičiuotas... Vidutinis atlyginimas paimtas iš „Head Hunter“ ir „Superjob“ (ir yra keletas kitų šaltinių) už tam tikrą laisvą vietą tam tikrame regione ir tam tikrame verslo kontekste.

    Iš „Avito“ ir „Avto.ru“ dažniausiai paimami papildomi parametrai, jei žmogus apšvietė telefoną. Su Avito matai, kokius daiktus žmogus parduoda – brangius, nebrangius, naudotus, nenaudotus. Su „Avto.ru“ matosi, ar jis turi automobilį – jam priklauso, jam nepriklauso. Tai yra mažiau nei 20 % žmonių, kurie netyčia kažkur numetė telefoną, ir jų paskyra gali būti susieta su šiais duomenimis.

Kokiais kiekiais dirba duomenų rinkimo įmonė?

  • Saugomų nuotraukų kiekis petabaitais yra 6,4. Tiksliai augimo tempo dabar pasakyti negaliu, nes 2016 metais pradėjome filmuoti „periskopus“, o tik pradėjome filmuoti.

    Negaliu tiksliai pasakyti, kada buvo nulis. Perėjome iš įmonės į įmonę – visa tai ilgos istorijos. Bet galiu pasakyti, kad VK, „Facebook“, „Instagram“ ir „Twitter“ - visas šis verslas (žmonės, grupės ir ryšiai tarp jų) su tekstu ir turiniu - iš tikrųjų tai nėra daug duomenų, vargu ar užteko net petabaito. Manau, kad tai 700 gigabaitų, tikriausiai 800.

Ar padedate klientams nustatyti dabartinę nišą ir kur ieškoti?

  • Kai ateina klientas, mes jam siūlome tokius dalykus, bet mes patys, kaip ir Google Trends, tokių dalykų nedarome.
  • Turėjome keletą beveik sociologinių istorijų, su rinkimų, priešrinkimine istorija – visa tai analizavome. Kalbant apie prekių ženklus ir vertinant nuomones apie prekių ženklus, viskas beveik visada sutampa. Štai rinkimų-rinkimų istorijos – ne (su įvertinimu, kuris kandidatas turėtų laimėti). Nežinau, kas čia neteisus – mes, ar tie, kurie mąsto VTsIOM.
  • Dažniausiai šiuos kontrolės rezultatus imame iš paties prekės ženklo, jie – iš bendražygių, kurie užsako tyrimus – tyrimus telefonu, rinkodaros tyrimus ir pan. Be to, visa tai galima patikrinti su pagrindiniais dalykais: kažkas atsakė į adresų sąrašą, kažkas atliko apklausas... Jei tai didelis prekės ženklas (pvz., Coca-Cola), jie tikrai turi milijoną ar du vidinius klientų atsiliepimus. – tai ne tik komentarai socialiniuose tinkluose ir kai kurios nuomonės; Tai yra kažkokios vidinės sistemos, apžvalgos ir pan.

Įstatymai „nežino“, kas yra asmens duomenys!

  • Mes analizuojame išskirtinai atvirus duomenų šaltinius ir niekada nesiveliame į jokius nešvarius triukus. Mūsų modelis paremtas tuo, kad visus atvirus duomenis saugome kai kuriuose viešuosiuose duomenų centruose, nuomojame kitur ir analizuojame namuose, biuruose, savo serveriuose ir jie niekur nekeliauja už teritorijos ribų.

    Tačiau mūsų teisės aktai atvirų duomenų srityje yra labai neaiškūs.

    Mes neturime aiškaus supratimo, kas yra atvirieji duomenys, kas yra asmens duomenys – yra šis 152-asis federalinis įstatymas, bet vis tiek... Kaip jie skaičiuojami? Dabar, jei aš turiu tavo vardą ir tavo telefono numerį vienoje duomenų bazėje, kitoje duomenų bazėje turiu tavo telefono numerį ir tavo el.paštą, trečioje turiu, tarkime, tavo el.paštą ir tavo automobilį; Atrodo, kad visa tai yra ne asmens duomenys. Sudėjus visa tai, panašu, kad pagal įstatymą tai taps asmens duomenimis.

    Mes tai apeiname dviem būdais. Pirmas yra įdiegti serverį su programine įranga klientui, o tada šie duomenys neperžengia jo teritorijos ribų, o tada klientas yra atsakingas už šių asmens duomenų, ne asmens duomenų platinimą ir pan. Arba antras variantas: jei tai kažkokia istorija, kai reikia paduoti į teismą socialinį tinklą ar dar ką nors...

    Turėjome tokį tyrimą, kai rinkome (buvo „Vieningosios Rusijos pirminiai“) „Lifenews“ šių bendražygių pasakojimus ir žiūrėjome, kokia pornografija jiems patinka. Tai buvo juokingas dalykas, bet vis tiek. Parduodame tai kaip savo, asmeninę nuomonę, teisiškai neatskleisdami dokumentuose, ką išanalizavome - Vieningo valstybinio juridinių asmenų registro, atlyginimų, socialinių tinklų; Parduodame ekspertų nuomonę, o tada nuošalyje paaiškiname žmogui, ką ir kaip išanalizavome.
    Buvo keletas istorijų, bet jos buvo susijusios su kai kuriais viešais komerciniais projektais. Pavyzdžiui, turime nemokamą pelno nesiekiantį projektą tiems, kurie važinėja longboardais (tokios lentos yra ilgos): užduotis buvo rinkti žmonių publikacijas – kai kas nors paskelbia „Išėjau į Gorkio parką pasivažinėti“. Ir dabar jis turėtų patekti į žemėlapį, o aplinkiniai pamatys, kad kažkas šalia jo. VK labai ilgai mumis blaškėsi šia tema, nes jiems nepatiko, kad šią informaciją skelbiame be žmonių leidimo. Bet tada reikalas nepateko į teismą, nes keliose didelėse bendruomenėse prie taisyklių pridėjome, kad duomenis gali naudoti tretieji asmenys, agentūros, įmonės, analizės ir pan. Žinoma, tai nebuvo itin etiška, bet vis tiek.

  • Tiesiog laiku tai supratome ir pradėjome visiems pardavinėti savo ekspertų nuomonę.

Ar dirbate su švietimo įstaigomis?

  • Bendradarbiaujame su švietimo įstaigomis, taip. Turime visą spektrą: turime magistrantūros studijų programą Aukštojoje mokykloje, bendradarbiaujame su kitais universitetais. Mes labai mylime universitetus!
  • Jei turite mano kontaktus, galite man parašyti. Ir nuoroda į pristatymą, jei kam įdomu - visi šie pavyzdžiai yra, galite perkelti.
  • Jei žinote telefono numerį, paštą – tai beveik šimtaprocentinis variantas, niekas jo nepašalins. Jei telefono numerio nėra, tai dažniausiai yra nuotrauka, jei nuotraukos nėra, tai metai, gyvenamoji vieta, darbas. Tai yra, pagal metus, gyvenamąją ir darbo vietą beveik kiekvieną visada galima gana subtiliai atpažinti. Bet tai vėlgi yra klausimas apie užduotį.

    Turime, tarkime, klientą, kuris parduoda internetinę televiziją. Kažkas iš jų įsigijo šių „Sostų žaidimų“ prenumeratą, o užduotis yra naudoti savo CRM, kad būtų galima rasti šiuos žmones socialiniuose tinkluose, o tada rasti galimus iš jų įtakos srities. Noriu pasakyti tik apie tai, kad jie turi, tarkime, vardą, pavardę ir el. paštą... Ir tada labai sunku ką nors padaryti. Daugeliu atvejų žmones galima rasti el.

  • Pagal draugų sudėtį dažniausiai „suderiname“ žmones socialiniuose tinkluose, tačiau tai ne visada teisinga. Nėra taip, kad tai ne visada teisinga – tai ne visada veikia. Pirma, tai reikalauja daug darbo, nes šią operaciją (žmonių derinimą) pirmiausia turės atlikti kiekvienas draugas – kad suprastų, ar jie atėjo iš socialinių tinklų, ar ne. Ir tada - niekam nežinomas faktas, kad „VKontakte“ turime tuos pačius draugus, „Facebook“ - skirtingų draugų. Ne visiems, bet man, pavyzdžiui, taip; ir tai galioja daugumai žmonių.

Kaip renkami išsamiausi duomenys?

  • Programinės įrangos diegimas klientui jo pusėje. Juose yra įdiegtas serveris, kuris iš mūsų paima tik viešus duomenis ir tvarko jų asmens duomenis viduje. Su klientu sudaromas NDA. Tai, žinoma, nėra labai teisinga, kad jie tai perduoda mums, tačiau teisinė atsakomybė tenka klientui - na, tai yra, įdiegti jam programinę įrangą arba perduoti anoniminius duomenis. Bet tai buvo labai reta, nes - teisingas ar neteisingas anonimiškumas - daugeliu atvejų priklausomybė tarp šių žmonių prarandama.

Kas perka veido atpažinimo programinę įrangą?

  • Iš tikrųjų einame čia, nes pagrindinė mūsų parduodama programinė įranga yra veidų paieška, koreliacijos analizė ir parduodame ją vyriausybinėms agentūroms. O prieš pusantrų metų nusprendėme, kad visas šias istorijas įdėsime į reklamą, į rinkodarą, į viešąją rinką – taip susikūrė komercinis juridinis asmuo Social Data Hub. O dabar kaip tik čia ateiname. Mes jau pusantrų metų čia sėdime ir bandome paaiškinti žmonėms, kad nereikia žmonėms duoti atsisiuntimų su paminėjimu, kad jiems reikia atsakyti į klausimus, kad nereikia toniškumo. , ir taip toliau. Taigi sunku pasakyti, kur...
  • (Ką turi omenyje?) Visiems bendražygiams, kuriems reikia ieškoti teroristų ir pedofilų.
    Iš karto galiu pasakyti (tai bus kitas klausimas): mūsų duomenimis, nė vienas mokytojas nebuvo įkalintas už persiuntimą.
  • „VKontakte“ - 14%; „Facebook“ uždaro profilio nėra (yra uždaras draugų sąrašas ir pan.). O įdomiausia, kad ką tik parašiau žinutę – dabar suskaičiuos ir pasakys.

Neskelbkite to, ko jums bus gėda!

  • Neskelbkite socialiniuose tinkluose nieko, dėl ko jums būtų gėda – aš asmeniškai tai seku. Nors asmeninių turėjau daug, nes feisbuke prisiekiu. Na, buvo ir buvo ką veikti... Neskelbkite nieko, kas būtų gėdinga! Jei vėliau ketinate dirbti kur nors Visuomenės rūmuose, taip, geriau nekomentuoti. Jei neketinate to daryti, tai niekam nerūpi. Galiu tik patikinti, kad jūsų asmeninio susirašinėjimo niekas neskaito, o visa tai kuria visą šią istoriją...

    Kiekvieną savaitę kažkas būtinai ateina pas mane ir sako: „Na, mano draugo nuotraukos buvo nutekintos į kažkokį anoniminį viešą puslapį! Pagalba! Beje, niekada nieko neskelbkite anoniminiuose viešuose puslapiuose.

  • Nežinau dėl kitų stebėjimo sistemų - į tai būtinai atsižvelgsime, kad prekės ženklo paminėjimas buvo neigiamas, atleisk Dieve... Bet galiu pasakyti, kad visokius artimuosius bendražygius domina tik žmonės kurių auditorija viršija 5 tūkstančius ir jų viešoji nuomonė gali ką nors paveikti.tada daryti įtaką. Mano patirtis rodo, kad niekada nėra nutikę taip, kad personalo agentūra, kuri pas mus užsako profilių vertinimus, pasakytų: „Kam patinka Navalnas, nieko nesamdykite!

Apie rezultatų paskelbimą. Kiek žmonių dirba moksliniuose tyrimuose?

  • Iš 10 geriausių reklamos kompanijų dabar leidžia leidybas septynios. Sunku pasakyti: kai tai pradėjome prieš pusantrų metų... Turime po kelis žmones kiekvienoje srityje – keli žmonės bankuose, keli žmonės personalo srityje, keli žmonės reklamoje. O dabar galvojame, kam pirmam eiti apsimoka, kam reikia pradėti daryti kažkokias sąsajas...
  • (apie zmoniu skaiciu viename rinkos segmente) Ne daugiau kaip 25 zmones, nes mes nieko neprievartavome.
  • Apskritai iš esmės šios technologijos iš rinkos yra naudojamos, manau, daugiau nei 50 proc. Vieni – reklamos kampanijose, kiti – kažkokioje vidinėje analizėje. Sakyčiau, 40 procentų jį naudoja vidinėje analizėje, 50–60 procentų parduoda galutiniams prekių ženklams. Bet tai jau priklauso nuo pačių reklamos kompanijų. Matote, vieni atsiskaito tiesiog už išleistus pinigus, įdėtą reklamą, o kiti rašo, kiek žmonių atvedė, kokią auditoriją... Sakyčiau taip, bet galiu klysti – aš ne. tikrai neįsivaizduoji, kaip dirba visi šie bendražygiai. Žinau tik kiekybiniais duomenimis.

Kai kurie skelbimai 🙂

Dėkojame, kad likote su mumis. Ar jums patinka mūsų straipsniai? Norite pamatyti įdomesnio turinio? Palaikykite mus pateikdami užsakymą ar rekomenduodami draugams, debesies VPS kūrėjams nuo 4.99 USD, unikalus pradinio lygio serverių analogas, kurį mes sugalvojome jums: Visa tiesa apie VPS (KVM) E5-2697 v3 (6 branduoliai) 10GB DDR4 480GB SSD 1Gbps nuo 19$ arba kaip dalintis serveriu? (galima su RAID1 ir RAID10, iki 24 branduolių ir iki 40 GB DDR4).

„Dell R730xd“ 2 kartus pigiau „Equinix Tier IV“ duomenų centre Amsterdame? Tik čia 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 televizoriai nuo 199 USD Olandijoje! „Dell R420“ – 2 x E5-2430 2.2 GHz 6C 128 GB DDR3 2 x 960 GB SSD 1 Gbps 100 TB – nuo ​​99 USD! Skaityti apie Kaip sukurti infrastruktūros korp. klasę naudojant Dell R730xd E5-2650 v4 serverius, kurių vertė 9000 eurų už centą?

Šaltinis: www.habr.com

Добавить комментарий