Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

14. marca 2017 je Arthur Khachuyan, izvršni direktor Social Data Huba, spregovoril na predavanju BBDO. Arthur je spregovoril o inteligentnem spremljanju, gradnji vedenjskih modelov, prepoznavanju foto in video vsebin ter drugih orodjih in raziskavah Social Data Hub, ki vam omogočajo ciljno publiko z uporabo družbenih omrežij in tehnologij Big Data.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Arthur Khachuyan (v nadaljevanju – AH): - Zdravo! Pozdravljeni vsi skupaj! Moje ime je Arthur Khachuyan, vodim podjetje Social Data Hub in ukvarjamo se z različnimi zanimivimi intelektualnimi analizami virov odprtih podatkov, informacijskih polj in opravljamo vse vrste zanimivih raziskav itd.

In danes so nas kolegi iz skupine BBDO prosili za pogovor o sodobnih tehnologijah za analizo velikih podatkov, velikih in manj velikih podatkov za oglaševanje: kako se uporabljajo, pokažite nekaj zanimivih primerov. Upam, da boste na poti kaj spraševali, ker lahko postanem dolgočasen in ne razkrijem bistva in tako naprej, zato ne bodite sramežljivi.

Pravzaprav so glavne smeri, kjer so bile kdaj uporabljene nekakšne rešitve "skoraj velikih podatkov", vse jasne - to je ciljanje občinstva, analiza, izvajanje neke vrste analitične trženjske raziskave. Vedno pa je zanimivo, katere dodatne podatke lahko najdemo, kakšne dodatne pomene lahko najdemo po uporabi analize.

Zakaj potrebujemo tehnologijo za oglaševanje?

Kje začnemo? Najbolj očitno je oglaševanje na družbenih omrežjih. Danes sem ga zjutraj snel: iz nekega razloga VKontakte meni, da bi moral videti ta oglas ... Ali je dober ali slab, je drugo vprašanje. Vidimo, da zagotovo spadam v kategorijo nabornikov:

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Prva in najbolj zanimiva stvar, ki jo lahko jemljemo kot tehnološko rešitev ... Prva stvar, o kateri sem se želel odločiti, preden začnemo, je opredelitev pojmov: kaj so odprti podatki in kaj veliki podatki? Kajti vsi imajo svoje pojme o tem in nikomur ne želim vsiljevati svojih pogojev, ampak ... Samo da ne bo razhajanj.

Osebno menim, da so odprti podatki vse, kar lahko dosežem brez prijave ali gesla. To je odprt profil na družabnih omrežjih, to so rezultati iskanja, to so odprti registri itd. Velike podatke, po mojem mnenju, vidim takole: če je tablica s podatki, je milijarda vrstic, če je nekakšna shranjevanja datotek je to nekje petabajt podatkov. Ostalo v moji terminologiji niso veliki podatki, ampak nekaj takega.

Visoko natančno profiliranje in točkovanje profilov

Gremo po vrsti. Prva in najbolj zanimiva stvar, do katere lahko pridete pri analizi odprtih virov podatkov, je visoko natančno profiliranje in točkovanje profilov. Kaj je to? To je zgodba, v kateri lahko vaš račun v družabnem omrežju predvidi ne le, kdo ste, ne le vaših interesov.

Zdaj pa lahko s kombiniranjem različnih virov razumete povprečno višino svoje plače, koliko stane vaše stanovanje in kje se nahaja. In vse te podatke je mogoče uporabiti dobesedno iz razpoložljivih sredstev. Na primer, če vzamete svoj račun na socialnem omrežju, poglejte, recimo, kje živite, kje delate; razumeti, v katerem delu podjetja je podjetje, v katerem delate; prenesite podobna prosta delovna mesta iz HH in "Superjob", če ste analitik, vodja itd.; poglejte, kje živite (baza, recimo CIAN), razumejte, koliko stane najem stanovanja v tem kraju, koliko stane nakup stanovanja v tem kraju, predvidejte približno, koliko zaslužite. Poleg tega lahko z uporabo socialnih omrežij razumete, koliko potujete, kje ste in kako zvesti ste delodajalcu.

Skladno s tem lahko iz tako velikega števila metrik naredimo karkoli želimo. Lahko vam predstavimo izdelek, ki vas zanima. Si lahko predstavljate spletno trgovino? Greš tja - ta spletna trgovina ujame tvoj račun na družbenem omrežju in ti reče: "Maša, pravkar si prekinila s fantom, tukaj je nekaj določenih izdelkov zate." To ni bližnja prihodnost...

Kako se določi geolokacija osebe?

Odgovori na vprašanja občinstva:

  • Običajno se 80% vseh prijav šteje za točen kraj bivanja. Za ljudi, ki se nikjer ne prijavljajo, pa obstaja več možnosti: ali prijava, ali geolokacija, ali pa je to analiza objav in objav za celotno obdobje, ko je oseba nekaj napisala ... In nekje, pojavilo se bo nekaj, kot je "Želim kupiti otroški voziček blizu Akademicheskaya" ali "Pred kratkim sem tukaj videl grde grafite na steni." To pomeni, da je za skoraj 80 % ljudi njihovo geolokacijo, njihov kraj dela in njihov kraj bivanja mogoče določiti s pomočjo podatkov ali metapodatkov, ki jih je mogoče zbrati iz družbenih omrežij.

    To je spet analiza objav. Najenostavneje je to analiza prijav in geolokacij v družabnih omrežjih, ki ne briše metapodatkov jpeg (iz tega se da kaj razbrati). Toda za preostale ljudi so to običajno besedilna oddajanja: bodisi oseba "osvetli" svojo lokacijo, ko piše o nečem, ali "osvetli" svoj telefon, po katerem lahko najdete nekaj njegovega oglaševanja na Avitu ali njegov račun na " Avto RU". Na podlagi teh podatkov lahko združite (na primer "Prodam avto v bližini Majakovske") in to približno domnevate.

  • Ljudje to običajno objavijo na družbenih medijih. Delamo samo z odprtimi viri in tukaj govorimo izključno o odprtih virih. Ponavadi objavljajo oglase, torej v šestdesetih odstotkih primerov so najpogostejša zgodba, ko se ljudem »pokaže« trenutna številka mobilnega telefona, oglasi za prodajo nečesa. Ali v nekaterih skupinah oseba piše ("Tam prodajam to ali ono") ali gre nekam.

    ja! Običajno komentirajo: »Odgovori mi ali mi pošlji SMS, pokliči mojo številko. To se zelo pogosto dogaja ljudem, ki nekaj prodajajo, kupujejo na družbenih omrežjih, komunicirajo z nekom ... Skladno s tem lahko s to številko nanjo povežete njegov profil na CIAN-u, če je kdaj kaj objavil, ali pa spet na Avito. To so preprosto najbolj priljubljeni, vrhunski viri, to bo še naprej - to so Avito, CIAN in tako naprej.

  • To se nanaša na spletno trgovino. Naslednja bo tehnologija prepoznavanja obraza in ujemanja profilov (o tem bomo govorili). Čisto teoretično je to mogoče uporabiti za trgovino brez povezave. In na splošno moje velike sanje so, da ko se pojavijo ulični transparenti, ko greš mimo kamere, ti »uklešči« obraz. Toda ta primer bo zakonsko prepovedan, ker gre za kršitev zasebnosti. Upam, da se bo prej ali slej zgodilo.
  • Iz osebnih izkušenj. Zelo pogosto, ko ti človek kaj napiše, operiraš z nekimi dejstvi iz njegovega življenja, ki jih na videz ne bi smel vedeti ... Ljudje se v večini primerov prestrašijo. Ampak! Na podlagi zadnjih statističnih podatkov se je število zaprtih računov na družbenih omrežjih zmanjšalo za 14 %. Število ponaredkov narašča, število odprtih računov narašča - ljudje se vse bolj premikajo k odprtosti. Mislim, da se bodo čez 3-4 leta nehali tako močno odzivati ​​na to, da nekdo pozna informacije o njih, ki jih potencialno ne bi smeli vedeti. Toda to je pravzaprav zelo enostavno ugotoviti, če pogledate njegov zid.

Kaj lahko vzamemo iz odprtih virov?

Obstaja približen seznam stvari, ki jih je mogoče z dokaj visoko zanesljivostjo razumeti iz odprtih virov. Pravzaprav obstaja še več različnih meritev; odvisno od naročnika tovrstnih raziskav. Obstaja neka kadrovska agencija, ki jo zanima, ali preklinjaš na družbenih omrežjih ali kje v javnem prostoru. Nekoga zanima, ali so vam všeč publikacije Navalnega ali, nasprotno, publikacije Združene Rusije ali kakšna pornografska vsebina - takšne stvari se dogajajo precej pogosto.

Glavne so družinske vrednote, približni stroški stanovanja, doma, iskanje avtomobila itd. Na podlagi tega lahko ljudi razdelimo v družbene skupine. To so moskovski uporabniki Tinderja, kdo so (glede na njihove slike na njihovih Facebook računih); glede na interese so razdeljeni v različne družbene skupine:

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Če se približamo oglaševanju, potem smo se počasi oddaljili od standardnega ciljanja oglaševanja, ko na VKontakte izberete, da vas zanimajo 18-letni moški, naročeni na določene skupine. Imam naslednjo sliko, zdaj vam jo bom pokazal:

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Bistvo je, da se večina trenutnih storitev, ki načeloma analizirajo ljudi, ki analizirajo socialna omrežja, ukvarjajo z analizo interesov ... Prva stvar, ki ljudem pride na misel, je analiza najvišjih skupin njihovih naročnikov. Morda to nekaterim deluje, a osebno menim, da je v osnovi napačno. Zakaj?

Vaši všečki se zbirajo in analizirajo

Zdaj pa vzemite svoje telefone, poglejte svoje top skupine - zagotovo bo več kot 50% skupin, na katere ste že pozabili, to je nekakšna vsebina, ki vam pravzaprav ni pomembna. Sploh ga ne porabite, a kljub temu vas bo sistem spremljal po njih: da ste naročeni na recepte, na kakšne popularne skupine. To pomeni, da boste kršili sistem, ki analizira vaš profil, in vaši interesi ne bodo upravičeni.

Gremo naprej ... Kaj je tam? Predvidevamo, kaj počnejo drugi ljudje. Po našem mnenju so všečki najprimernejši način za oceno interesov uporabnikov. V VKontakte na primer ni vira všečkov in ljudje mislijo, da nihče ne ve, kaj jim je všeč. Da, nekateri všečki so uvedeni na Instagramu, nekaj vidimo na Facebooku, ampak večina vsebin v določenih skupinah tega ne predvaja v skupnem viru in ljudje živijo in mislijo, da nihče ne bo vedel, kaj jim je všeč.

In z zbiranjem določene vsebine, ki nas zanima, zbiranjem teh objav, zbiranjem teh všečkov, nato preverjanjem te osebe z uporabo te baze podatkov, lahko z veliko natančnostjo ugotovimo, kdo je, kakšna je njegova usoda, kaj jo zanima. Postavite ga natančno v določeno družbeno skupino in komunicirajte z njim.

Nakup avtomobila spremeni vedenje

Imam tak primer. Takoj bom pridržal, da so moji primeri skoraj oglaševalski in skoraj trženjski, saj veste, večina primerov je zaščitenih z NDA in tako naprej. Bo pa še veliko zanimivega. Torej, zgodba s temi ljudmi: to so moški, ki so med letoma 2010 in 2015 kupili avto. Kako se je njihovo spletno družbeno vedenje spremenilo, je prikazano z barvo. Spremenil se je odstotek deklet med naročniki, naročil sem se na “fantovske” javne strani, našel stalnega spolnega partnerja ...

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Vse to je razčlenjeno po znamki avtomobila in številu ljudi. Od tu lahko potegnete veliko zanimivih zaključkov o vedenju ljudi in o tem, kako vse skupaj deluje. Lahko rečem, da sta Porsche Cayenne in nasajena Priora po številu privabljenega občinstva skoraj enaka. Kakovost te publike in njihovo vedenje sta različni, kvantiteta pa približno enaka. Zaključek, ki ga lahko potegnete od tukaj, je karkoli želite, bližje vašemu trgu. Če prodaš audija, narediš slogan "Kupi audija in pobegni stran od staršev!" in tako naprej.

Ja, to je smešen primer dejstva, da vedenje ljudi na podlagi analize všečkov, glede na to, v katero skupino se premaknejo, katere vsebine analizirajo - s skoraj 100% verjetnostjo pove, kdo ste. Ker če nimate dostopa do omrežnega prometa in ne berete osebnih sporočil, vam bodo všečki vedno povedali, kdo je ta oseba - nosečnica, mati, vojak, policist. In za vas, kot osebo, ki lahko oglašuje, je to velik zadetek v tarčo.

Odgovori na vprašanja občinstva:

  • Vsak stolpec je število ljudi v tem avtomobilu; kako so se spremenili njihovi vedenjski vzorci. Poglejte: ljudje, ki so kupili Porsche Cayenne - približno 550 ljudi (rumena), odstotek deklet med naročniki se je povečal.
  • Vzorec so uporabniki socialnih omrežij "Vkontakte", "Facebook", "Instagram" od leta 2010 do 2015. Edino pojasnilo: tukaj izbrani avtomobili so tisti, ki jih je mogoče z določenimi orodji prepoznati na fotografijah z več kot 80-odstotno natančnostjo.
  • V določenem času njegov avto (no, ne njegov, to prepuščamo družbenim omrežjem) ... V določenem času je bila oseba nenehno fotografirana z avtom, bila z njim, objave so bile različne, fotografije so bile iz različnih zornih kotov itd. Tam bo potem slika, kateri ljudje se slikajo s katerimi avtomobili in ... Ja, to je drugo vprašanje - zaupanje v podatke socialnih omrežij.
  • Odkar smo omenili, žal podatki družbenih medijev niso vedno pravilni. Ljudje niso vedno nagnjeni k objavi svojih informacij. Osebno sem izvedel takšno študijo: primerjal sem število diplomantov moskovskih univerz s številom ljudi, registriranih na družbenih omrežjih. V povprečju je na družbenih omrežjih registriranih 60% več ljudi - diplomantov Moskovske državne univerze v določenem letu na določenih specialitetah - kot jih je načeloma dejansko. Tako da ja – tu je seveda odstotek napak in tega nihče ne skriva. Tukaj preprosto vzamemo za osnovo tiste avtomobile, ki jih je mogoče identificirati z več kot 80-odstotno verjetnostjo.

Seznam virov za usposabljanje modelov

Tukaj je vzorčni seznam virov, ki jih je mogoče uporabiti, s katerimi se z veliko gotovostjo določi socialni profil osebe, kdo je.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Vzamemo profil iz družbenih omrežij, iz CIAN - stroški stanovanja so približno, "Head-Hunter", "Superjob" - to je povprečna plača za določeno osebo. Upam, da tukaj ni predstavnikov Head Hunterja, ker menijo, da ni dobro jemati te podatke od njih. Je pa to povprečna plača v določenih regijah za določene vrste dejavnosti za prosta delovna mesta.

“Avito”, “Avto.ru”: zelo pogosto ljudje, ko je njihov telefon osvetljen, zagotovo imajo (v velikem številu primerov) vsaj nekaj na “Avito”, ali na “Avto.ru”, oz. na drugem več spletnih mest, iz katerih lahko razberete, kdo so. Če je bil na tej telefonski številki prodan otroški voziček ali avto ... Rosstat in Enotni državni register pravnih oseb sta še vedno več registrov, s pomočjo katerih lahko razvrstite podjetje delodajalca - po neki formuli, po modelu, ki katera koli oseba lahko nastavi (približno lahko določite denar te osebe itd.).

Tinder pomaga zbirati podatke o položaju ljudi

Poleg tega obstaja tako zanimiva stvar (druga možnost je, da je v študiji zelo smešna) - to je spet zbiranje podatkov moskovskega Tinderja z uporabo botov za ta Tinder. Določena je bila razdalja do ljudi, nato pa še njihova približna lokacija.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Cilj te študije je bil ugotoviti število računov Tinder na ozemlju državnih institucij - v dumi, tožilstvu itd. Vi pa si kot oglaševalec lahko predstavljate, kar hočete: lahko je to na primer Starbucks ali kdo drug ... Se pravi, koliko ljudi na Tinderju pri vas pije kavo, nekaj naroča, je v trgovinah. Glede te geolokacije: to je mogoče storiti s katero koli storitvijo.

Odgovor na vprašanje iz publike:

  • Tinder? Ne veš? Tinder je aplikacija za zmenke, kjer gledate fotografije (levo-desno), ta aplikacija pa vam pokaže razdaljo do osebe. Če razdaljo do te osebe dobite s treh različnih točk, lahko približno (+ 5-7 metrov) določite lokacijo. V tem primeru za določitev na ozemlju tožilstva ali državne dume ni tako težko. Ampak spet, lahko je vaša trgovina, lahko je karkoli.

Na primer, dolgo, dolgo nazaj smo imeli tak primer (ne študija), ko smo od enega od mobilnih operaterjev prejeli podatke o gostoti prometa, podatke o gostoti gibanja celičnih točk, in vse te informacije so bile prekrite na koordinatah reklamnih panojev na avtocestah. In naloga mobilnega operaterja je približno ugotoviti, koliko ljudi gre mimo in bi lahko videlo ta oglasni pano.

Če so tukaj strokovnjaki za oglaševanje na panojih, lahko rečete: nemogoče je razumeti s super zanesljivostjo - nekdo prihaja, nekdo ni pogledal, nekdo je pogledal ... Kljub temu je to primer, kako obstaja 20 milijard poligonov ti v Moskvi, na kateri je gostota teh ljudi na vsako uro po določenih poteh ... V vsakem trenutku lahko vidite, mimo česa so ti ljudje šli in približno ocenite potniški tok.

Odgovor na vprašanje iz publike:

  • Nihče ne daje takih podatkov. Takšno raziskavo smo izvedli za enega od operaterjev, to je izključno interna zgodba, zato žal ni predstavljena v obliki slik. Toda pogosto velike oglaševalske agencije nimajo težav pri stiku z operaterjem. Vsaj v Moskvi je veliko primerov, ko se na primer zavarovalnice obrnejo na podjetja, kot je GetTaxi, ki posredujejo neosebne podatke o starosti voznika, o tem, kako vozi (dobro - slabo, nepremišljeno - ne), da bi predvideli politike in tako naprej. Vsi se borijo s tem, ampak na neki notranji ravni, podajanje anonimnih podatkov - mislim, da nihče nima takšnega problema.

Prepoznavanje slik in vzorcev

Kar daj. Moja najljubša je prepoznavanje slik. Tam bo majhen del o iskanju ljudi po obrazih, vendar tega dela večinoma ne vzamemo. Posebej se ukvarjamo s prepoznavanjem slike in določanjem, kaj je na tej sliki - znamka avtomobila, njegova barva itd.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Imam ta smešen primer:

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Obstajala je taka študija o iskanju tetovaž na različnih družbenih omrežjih. Skladno s tem se lahko enako uporabi za katero koli blagovno znamko, za vsako vizualno podobo, za skoraj vsako vizualno podobo. Obstajajo takšni, ki jih ni mogoče zanesljivo določiti (teh ne jemljemo).

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Tukaj je moj najljubši. Avtomobilske znamke se pogosto obračajo na to nalogo, ker je njihova naloga na primer najti vse lastnike nekega BMW X6, razumeti, kdo so, kako so med seboj povezani, kaj jih zanima itd. To se nanaša na vprašanje, s kakšnimi avtomobili se ljudje slikajo na družbenih omrežjih.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Tu sploh ni bilo filtriranja: predmet je bil njihov, avto ni bil njihov; To je samo okvara avtomobilov - starost in tako naprej. Toda vizualno prepoznavanje podob se uporablja precej pogosto: to je iskanje nosečnic in iskanje logotipov blagovnih znamk v kakšnih množičnih medijih (kdo kaj objavi).

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Moj najljubši primer (ki se ga poslužujejo razne restavracije): kakšne zvitke objavljajo na socialnem omrežju. To je smešno, a v resnici vam omogoča, da razumete veliko zanimivih stvari, najprej o svojih strankah: kdo je prišel k vam in zakaj so to storili. Ker ni skrivnost, da se v suši barih večina ljudi (ne bom rekel "dekleta") slika, da bi se prijavila, kaj fotografirala itd.

Blagovna znamka lahko to izkoristi. Blagovno znamko zanima, kakšne izdelke mora lepo fotografirati in objaviti, kakšni ljudje so prišli tja. To stvar je mogoče narediti s skoraj vsem, od hrane.

Video prepoznavanje vzorcev

Odgovor na vprašanje iz publike:

  • Ne na videu. Imamo ga v testnem načinu. Poskusili smo s to tehnologijo, a se je izkazalo, da ... Kar dobro prepozna vse z videom, vendar nikjer nismo našli aplikacije zanjo. adijo Poleg analize, koliko in kateri video blogerji nekje govorijo ... Bila je taka študija. Koliko njihovih obrazov se sreča, kako pogosto. Toda blagovne znamke še niso ugotovile, kje bi se tega domislile. Morda bo nekoč prišlo.

Še enkrat, to je hrana, lahko so nosečnice, moški (ne noseči), avtomobili - karkoli.

Kot opcija je bila na voljo novoletna študija za en medij. Tudi daleč od oglaševanja, a vseeno. Takole so se ljudje postili za novo leto:

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Tudi tukaj je razdeljen po starosti. Vidi se taka korelacija, da mladi večinoma naročajo hrano, odrasli večinoma pripravijo tradicionalno mizo. Smešno, a če si to predstavljate kot lastnika blagovne znamke, lahko ocenite veliko stvari: kdo in kako ravna z vašim izdelkom, kaj o njem piše. Ljudje pogosto v besedilu ne omenjajo same blagovne znamke, tradicionalni analitični sistemi za spremljanje pa te omembe znamke ne morejo vedno razumeti in najti zgolj zato, ker v besedilu ni omenjena. Ali pa je besedilo napačno črkovano, ni zgoščenih oznak ali česar koli.

Fotografije so vidne. Pri fotografiji lahko ugotovite, ali je osrednji motiv okvirja ali ne. Potem lahko vidite, kaj je ta oseba napisala. Najpogosteje pa se uporablja kot iskanje potencialne publike, ki je vozila določene avtomobile in tako naprej. In potem bomo s temi avtomobili počeli marsikaj zanimivega.

Boti so naučeni posnemati ljudi

Obstajala je tudi taka možnost za uporabo štetja ljudi:

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Obstaja možnost za primerjavo ljudi, ko morate najti ljudi s pomočjo nekaterih fotografij, razumeti njihov socialni profil, kdo so. Spet se vračamo k vprašanju, da če imamo kamero v trgovini brez povezave, potem je to dokaj dober način, da razumemo, kdo pride k vam, kdo so ti ljudje, kaj jih zanima, kaj jih je spodbudilo, da so prišli k vam .

Sledi najbolj zanimiva stvar: če zberemo njihove račune na družbenih omrežjih, razumemo, kdo so ti ljudje, kaj jih zanima, lahko (kot možnost) naredimo bota, podobnega tem ljudem; ta bot bo začel živeti kot ti ljudje in bo analiziral, katere oglase vidi na različnih socialnih omrežjih. Tako boste lahko natančno razumeli, katere blagovne znamke so namenjene tej osebi. To je tudi dokaj pogosta zgodba, ko morate analizirati ne samo, kdo je ta oseba in kakšne interese ima, ampak tudi, na kakšno oglaševanje naj ciljajo vaši potencialni konkurenti ali drugi zainteresirani.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Analiza povezav v socialnih omrežjih

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Naslednja zanimivost je analiza odnosov med ljudmi. Pravzaprav analiza povezav v omrežju, ti omrežni grafi - v tem ni nič, nič novega, to vsi vedo.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Najbolj zanimiva pa je aplikacija za oglaševalske naloge. To je iskanje ljudi, ki postavljajo trende, to je iskanje ljudi, ki širijo informacije po določenih kriterijih znotraj tega omrežja. Recimo, da nas zanimajo isti lastniki določenega modela BMW. Če združimo vse skupaj, lahko najdemo tiste, ki nadzorujejo javno mnenje. To niso nujno avtomobilski blogerji in tako naprej. Običajno so to preprosti tovariši, ki sedijo na različnih javnih straneh, jih zanima določena vsebina in lahko v zelo kratkem času privabijo vašo blagovno znamko ali nekoga, ki vas zanima, na to področje odgovornosti, na področje ​obresti.

Tukaj je tak primer. Imamo nekaj potencialnih ljudi, povezav med ljudmi. Tukaj oranžne so ljudje, majhne pike so skupne skupine, skupni prijatelji.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Če zbereš vse te povezave med njimi, lahko zelo jasno vidiš, da obstajajo ljudje, ki imajo veliko število skupnih skupin, skupnih prijateljev, so tam med seboj ... In če se ta ista vizualizacija razdeli na skupine po interesih, po vsebini, katero distribuirajo, koliko komunicirajo drug z drugim ... Tukaj lahko vidite, da je prejšnja slika postala taka:

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Tu se skupine jasno razlikujejo po barvi. V tem primeru so to naši magistrski študenti na Višji ekonomski šoli. Tukaj lahko vidite, da so vijolično/modri tisti, ki imajo radi Transparency International, Open Russia in javne strani Hodorkovskega. Spodaj levo so zeleni, tisti, ki ljubijo Enotno Rusijo.

Vidite, da je bila prejšnja slika takšna (to so le povezave med ljudmi), vendar je postala jasno razmejena. To pomeni, da so vsi ljudje med seboj vedno povezani, imajo enake interese, so prijatelji med seboj. Eni so zgoraj, drugi spodaj in še nekateri drugi tovariši. In če je vsak od teh majhnih podgrafov ločeno vizualiziran z drugimi parametri in gleda na hitrost širjenja vsebine (grobo rečeno, kdo tam kaj ponovno objavi), lahko v vsakem delu najdete enega ali dva človeka, ki vedno držita javno mnenje v svojih rokah, interakcijo s katerim, prošnjo za pošiljanje neke vrste objave ali kaj drugega - lahko dobite odgovor celotnega tega zanimivega občinstva.

Imam še en tak primer. Tudi graf: to so zaposleni BBDO Group, ki jih najdemo na družbenih omrežjih kot primer. Videti je nezanimivo, veliko, zeleno, povezave med njimi...

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Imam pa možnost, kjer so med njimi že zgrajene skupine. Potem, če koga zanima, je interaktivna različica - lahko klikne in pogleda.

Desno zgoraj so tisti, ki ljubijo Putina. Tukaj so vijoličasti oblikovalci; tiste, ki jih zanima dizajn, kaj zanimivega ipd. Tukaj so bele stvari vodstvena ekipa (očitno, kot razumem); To so ljudje, ki na splošno niso nič povezani, a delajo na približno enakih položajih. Ostalo so njihove skupne skupine, povezave ipd.

Znamke ne potrebujejo blogerjev, ampak mnenjske voditelje

Te ljudi vzamemo in jih najdemo - potem se oglaševalska agencija, oglaševalsko podjetje odloči, ali lahko tej osebi da denar, da nekako komunicira s to vsebino, nečim drugim, ali pa nanje usmeri svojo specifično oglaševalsko kampanjo. To se uporablja tudi precej pogosto, še posebej zdaj, ker vse znamke želijo sodelovati z blogerji, želijo, da se njihova vsebina promovira, oglaševalske agencije pa ne želijo kontaktirati (no, to se zgodi).

In pravi izhod iz te situacije je najti ljudi, ki niso blogerji, ne lepotni blogerji, ampak na primer nekaj resničnih bitij, ki komunicirajo s to znamko, ki lahko pišejo na neki bedni javni strani "Mail.ru Answers", dobijo določeno število ogledov. Ti ljudje, ki se nenehno zanimajo za vsebino te osebe, bodo razširili celotno stvar in blagovna znamka se bo vključila.

Druga možnost za uporabo takšne tehnologije je zdaj zelo pomembna - iskanje botov, moje najljubše. To je tveganje za ugled vaših konkurentov in priložnost, da iz oglaševalske kampanje izločite nepomembne ljudi in še kaj (brisanje komentarjev, iskanje povezav med ljudmi). Imam tak primer, je tudi velik in interaktiven - lahko ga premikate. To so povezave ljudi, ki so pisali komentarje v skupnosti Lentach.

Ta primer je zato, da razumete, kako dobro in lahko vidni so roboti; in za to vam ni treba imeti nobenega tehničnega znanja. To pomeni, da je "Lentach" objavil objavo o preiskavi FBK o Dmitriju Medvedjevu in nekateri ljudje so začeli pisati komentarje. Zbrali smo vse ljudi, ki so pisali komentarje - ti ljudje so zeleni. Zdaj ga bom premaknil:

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Ljudje so tisti zeleni (ki so pisali komentarje). Tukaj so, tukaj so. Modre pike med njimi so njihove skupne skupine, rumene pike so njihovi skupni naročniki, prijatelji itd. Večina ljudi je med seboj povezanih. Ker, ne glede na teorijo treh, štirih, petih rokovanj, so vsi ljudje med seboj povezani na družbenih omrežjih. Ni ljudi, ki bi bili ločeni drug od drugega. Tudi moji socialno fobični prijatelji, ki uporabljajo VKontakte izključno za gledanje videoposnetkov, so še vedno naročeni na nekatere iste javne strani kot mi.

Navalni uporablja tudi bote. Vsi imajo robote

Večina ljudi (tukaj je, tukaj) je med seboj povezanih. Je pa tako majhna skupina tovarišev, ki so prijatelji izključno med seboj. Tukaj so, mali zeleni, tukaj so njihovi skupni prijatelji in skupine. Tukaj so celo odpadli ločeno:

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

In po srečnem naključju so prav ti ljudje, ki so pod to objavo zapisali: "Navalni nima dokazov" in tako naprej, napisali enake komentarje. Seveda si ne upam delati sklepov. Ampak kljub temu sem imel še eno objavo na Facebooku, ko je bila razprava med Lebedjevom in Navalnim, sem analiziral komentarje na enak način: izkazalo se je, da vsi ljudje, ki so napisali "Lebedev je sranje", niso bili na družbenih omrežjih. omrežjih pred kratkim štiri mesece, ni bil naročen na nobeno javno stran, je nenadoma šel na to posebno objavo, napisal natančno ta komentar in odšel. Spet je nemogoče sklepati od tukaj, vendar mi je nekdo iz ekipe Navalnega napisal komentar, da ne uporabljajo botov. No, v redu!

Bližje oglaševanju, bližje blagovni znamki. Zdaj imajo vsi robote! Imamo jih mi, imajo jih naši konkurenti in drugi. Treba jih je vreči ven ali pustiti, da dobro živijo; Na podlagi takšnih podatkov (pokaže na prejšnji diapozitiv) jih pripeljite do popolnosti, da bodo videti kot pravi ljudje in jih šele nato uporabite. Čeprav je uporaba botov slaba! Vseeno pa dokaj pogosta zgodba...

V samodejnem načinu vam taka stvar omogoča, da iz analize izločite ljudi, ki niso pomembni za analizo, ljudi, ki ne bi smeli biti vključeni v vzorec, ne bi smeli biti vključeni v to študijo. Zelo pogosto uporabljen. In spet, vsi lastniki avtomobilov dejansko nimajo avtomobilov. Včasih ljudi zanimajo samo ljudje, ki imajo potencialno avto, ki sedijo v nekih skupinah, komunicirajo z nekom, tam imajo določeno občinstvo.

Analiza dejstev in mnenj

Naslednja, ki jo imam, je tudi moja najljubša. To je analiza dejstev in mnenj.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Dandanes vsak ve, kako omeniti svojo blagovno znamko v različnih virih. V tem ni skrivnosti. In zdi se, da vsi znajo izračunati tonaliteto ... Čeprav osebno menim, da sama metrika tonalnosti ni zelo zanimiva, ker ko prideš stranki in rečeš: "Človek, imaš 37% nevtralnega," in to reče. , »Vau! Kul!" Zato bi bilo bolj zanimivo premakniti se nekoliko dlje: od ocene sentimenta do ocene mnenj o tem, kaj pravijo o vašem izdelku.

In to je tudi zelo zanimiva stvar, ker ... Osebno menim, da načeloma ne more biti nevtralnih sporočil, ker če človek nekaj napiše v javnem prostoru, je to sporočilo nekako obarvano. Osebno še nikoli nisem videl nevtralnega sporočila, ki bi omenjalo blagovno znamko. Običajno je to nekakšna umazanija.

Če vzamemo veliko število teh sporočil (lahko jih je na milijone, 10 milijonov), iz vsakega sporočila izpostavimo glavno idejo, jih združimo, lahko precej zanesljivo razumemo, kaj ljudje pravijo o tej znamki, kaj si mislijo. »Ni mi všeč embalaža«, »Ni mi všeč konsistenca« itd.

Kaj si ljudje mislijo o Transaeru, Chupa Chupsu in predsedniku ZDA?

Imam smešen primer: to je infografika o tem, kaj bi uporabniki socialnih omrežij počeli s podjetjem Transaero po njegovem stečaju.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Tam je veliko zanimivih primerov: zažgite, pobijte, deportirajte v Evropo, celo 2 % jih je zapisalo - "Pošljite jih v Sirijo v vojaške operacije." Če se premaknemo od smešnega, bi lahko bila skoraj katera koli znamka – od moje najljubše pasje hrane do nekaterih avtomobilov. Komur ni všeč embalaža, kdor nima rad pravih stvari – s tem lahko vedno delaš, vedno lahko to upoštevaš. Veliko je primerov, ko so ljudje skoraj spremenili proizvodnjo svojih izdelkov, ker so na družbenih omrežjih pisali, da Chupa Chups ni dovolj okrogel ali pa je premalo sladek.

Obstaja še en smešen primer. Uganete, kakšni komentarji in o kom?

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Iz nekega razloga se zdaj analiza mnenj, analiza dejstev, pridobljenih iz sporočil, ne uporablja preveč in ni zelo razširjena. Čeprav ta tehnologija ni super skrivnost, pri tem praktično ni nobenega znanja in izkušenj, saj iz komentarjev ljudi izločanje subjekta, predikata in njihovo združevanje ne zahteva genija v računalniški lingvistiki. To ni tako težko narediti. Ampak upam, da bodo v naslednjih nekaj letih ljudje začeli uporabljati to, ker ... To bo kul - to je taka samodejna povratna informacija! Vedno veš, kaj govorijo o tebi. No, razumete, da je bilo to narejeno o ameriškem predsedniku.

Odgovor na vprašanje iz publike:

  • Da, to je Facebook v angleščini. Tukaj so prevedeni v ruščino. To je bilo nekje napisano.

Veliki podatki in politične tehnologije

Pravzaprav imam veliko različnih zanimivih političnih primerov o Trumpu in vseh drugih, vendar smo se odločili, da jih ne bomo prinesli sem. Obstaja pa en politični primer.

To so volitve v državno dumo. Kdaj si bil? Lansko leto? Pred skoraj letom in pol.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Tukaj so ljudje, ki so lahko določili svojo natančno lokacijo, do določene geotočke, da bi razumeli, v kateri volilni okraj sodijo. In potem so bili od teh ljudi vzeti samo tisti, ki so izrazili svoje dokončno mnenje, za katerega bi glasovali.

Z vidika politične tehnologije to ni zelo pravilno, ker je treba vse skupaj normalizirati z gostoto prebivalstva in tako naprej. Kljub temu bodo tukajšnji modri volili veste koga, rdeči bodo volili opozicijske tovariše, ki jih, mimogrede, ni bilo veliko.

Osebno verjamem, da Big Data še ne bo tako kmalu dosegel političnih tehnologij, a po možnosti je kandidat tudi blagovna znamka. In to je do neke mere tudi analiza dejstev in mnenj o vaši blagovni znamki in precej zanimiva stvar, saj lahko v realnem času razumete, kdo kaj počne. Poznam več primerov z BBC-ja, ko so v neki oddaji spremljali družbena omrežja v realnem času: bil je tak in tak odziv, ljudje pišejo o tem, postavljajo tako in tako vprašanje - in to je super! Mislim, da bo zelo kmalu v uporabi, ker je vsem zanimiva.

Modeliranje pozicij blagovne znamke

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Sledi modeliranje pozicij blagovnih znamk. Majhen, kratek del o tem, kako lahko blagovne znamke razvrstite z različnimi metrikami (ne všečki naročnikov na družbenih omrežjih, ampak z uporabo kompleksnih metrik, zanimanja za vsebino, časa, porabljenega za prejemanje metrik).

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Iz določenega razloga imam primer "farmake". Tu so majhni krogi notranji, svetli - to je količina besedilne vsebine, ki jo ustvari blagovna znamka sama, velik krog je količina foto in video vsebine, ki jo ustvari blagovna znamka sama.

Bližina centra kaže, kako zanimiva je vsebina za občinstvo. Obstaja velik model, obstaja kup najrazličnejših parametrov: všečki, ponovne objave, odzivni čas, kdo je v povprečju delil ... Tukaj lahko vidite: obstaja čudovit "Kagotsel", ki črpa ogromno denar v ustvarjanje lastnih vsebin, zaradi tega pa so precej blizu centra. In obstajajo tovariši, ki prav tako ustvarjajo lastno vsebino, vendar to občinstva ne zanima. To ni zelo primeren primer, saj so vsi ti računi tako rekoč mrtvi.

Yegor Creed je ljubljen bolj kot Basta

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Na žalost, ostalo ... od tega, kar pokazati ... No, obstajajo tudi ruski raperji, kot možnost, iz pravih podjetij.

Kaj je plus? Dejstvo je, da lahko podjetje v takšen model vloži skoraj vse, od povprečne plače naročnikov, ki delajo za vašo znamko; katerikoli model, ki jim je všeč. Ker vsaka oglaševalska agencija izračuna svoje meritve drugače, blagovne znamke izračunajo svoje meritve drugače.

Tu je tudi ena - Basta, ki ustvarja veliko količino vsebine, vendar se nahaja na obrobju, ker ta vsebina očitno ni preveč zanimiva za občinstvo. Še enkrat, ne upam si soditi. Toda kljub temu obstaja Yegor Creed, ki je po družbenih omrežjih skoraj najboljši izvajalec našega časa, vendar objavlja le svoje osebne fotografije. Kljub temu ima veliko število naročnikov: nekje okoli milijon jih je. Točnega števila se ne spomnim; Spomnim se, da je odstotek angažiranosti teh ljudi veliko višji od 85%, to pomeni, da na milijon naročnikov prejme 850 tisoč odgovorov teh resničnih ljudi - to je prava norost. To je resnica.

Arthur Khachuyan: »Prav veliki podatki v oglaševanju«

Odgovori na vprašanja občinstva:

Koliko časa je trajalo ustvarjanje modela raperske analize?

  • Vsak ima svojo ciljno publiko, interesi teh ljudi so izračunani za vsakega ... Vse to je normalizirano na razdaljo do središča približno, njihova radialna lega ni pomembna (tu je preprosto zamazana zaradi lepote, tako da ne zaletita se drug v drugega). Pomembna je le približna bližina centra. To je model, ki ga uporabljamo. Na primer, meni je bolj všeč krog, nekateri ga delajo v mislih kot polkrog.
  • Ta model je bil sestavljen hitro, v dveh ali treh urah (ja, ena oseba). Tu so bile vstavljene samo metrike: kaj s čim pomnožimo, seštejemo in nato nekako normaliziramo. Odvisno od modela. Obstajajo ljudje, ki jih zanima povprečna plača (to ni šala) njihovih naročnikov. In za to morate najti njihove kontakte, Avito, vse izračunati, pomnožiti. Zgodi se, da to traja dolgo, da se upošteva, toda posebej to (pokaže na prejšnji diapozitiv) - parametri tukaj so zelo preprosti: naročniki, ponovne objave in tako naprej. Za dokončanje je trajalo približno dve do tri ure. V skladu s tem se ta stvar nato posodobi v realnem času in jo lahko uporabljate.

Zdaj prihaja zabavni del. Končal sem s primeri, ker ni zanimivo govoriti dolgo sam. In upam, da boste zdaj postavljali vprašanja in bomo dejansko prešli iz teme v temo, ker imam take primere, kako se lahko uporabljajo tehnologije in tako naprej ...

Odgovori na vprašanja občinstva:

  • Imel sem en in edini osebni primer z enim, tako rekoč, »blizu casinoja«, ko so tam postavili kamero, prepoznali obraze itd. Odstotek prepoznanih je vsekakor kar velik - tako naših kot naših konkurentov. Je pa pravzaprav zelo zanimivo. To se mi zdi zanimivo: lahko razumeš, kdo so ti ljudje, in precej dobro predvidevaš, zakaj točno so prišli sem, kaj se je v njihovem življenju tako spremenilo, da so se odločili priti v igralnico. Kar pa se tiče določenih vrst poslovanja ... Če tako stvar postavite v lekarno, potem nima smisla - ne morete predvideti, zakaj je oseba prišla v lekarno.

    Globalna naloga tukaj je bila zgraditi model, da bi razumeli, kdaj se oseba potencialno želi zanimati za vašo blagovno znamko, tako da mu lahko daste reklamo ne potem, ko je nekaj kupil (kot se dogaja zdaj), ampak mu dajte reklamo " v napovedi«, kdaj se bo vse to zgodilo. Zanimivo je bilo s tako "pri-kazino"; izkazalo se je, da je precej zanimiv odstotek teh ljudi - zakaj: nekdo je nenadoma prejel napredovanje, nekdo drug je dobil nekaj drugega - tako zanimiva spoznanja. Ampak z nekaterimi trgovinami, z maloprodajo, s trgovino z nekakšnimi tabletami, se mi zdi, da ne bo zelo pravilno.

Ali se veliki podatki uporabljajo brez povezave?

  • Bilo je brez povezave. Samo natančno, približno morate razumeti, ali bo ta model ustrezal ali ne. Spet pri gazirani vodi ... Mene pravzaprav vse zanima, a meni osebno ni jasno, koliko, kako so lahko profili teh ljudi, njihovo obnašanje odvisni od tega, kdaj želijo kupiti ustekleničeno vodo. Čeprav je to morda res res, ne vem.

Koliko odprtih računov na družbenih omrežjih je?

  • Konkretno imamo 11 socialnih omrežij - to so "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagram" in nekaj malenkosti (lahko pogledam seznam, kot je "Mail.ru" in tako naprej) . Na VKontakte zagotovo imamo kopijo vseh teh tovarišev. Na VKontakte imamo ljudi - to je 430 milijonov vseh, ki so kdaj obstajali (od tega jih je približno 200 milijonov nenehno aktivnih); obstajajo skupine, obstajajo povezave med temi ljudmi in obstaja vsebina, ki nas zanima (besedilo), in del medijev, vendar zelo majhen ... Grobo povedano, pogledamo to sliko: če so tam obrazi, shranimo jih, če obstaja meme, jih shranimo. Ne shranimo ga, ker tudi mi ne bi imeli dovolj, da shranimo medijsko vsebino.

    Obstaja Facebook v ruskem jeziku. Nekje zdaj je 60-80% Odnoklassnikov, čez nekaj mesecev jih bomo verjetno vse spravili do konca. Ruski Instagram. Za vsa ta socialna omrežja obstajajo skupine, ljudje, povezave med njimi in besedilo.

  • Približno 400 milijonov ljudi. Obstaja subtilnost: obstajajo ljudje, katerih mesto ni določeno (so potencialno ruski / ne-ruski); Od tega je povprečje za socialna omrežja 14% zaprtih računov na VKontakte, ne vem točne številke na Facebooku.
  • Prav tako ne shranjujemo medijev na Instagramu – samo če so tam obrazi. Takih (drugih) medijskih vsebin ne hranimo. Ponavadi zanimivo: samo besedilo, povezave med ljudmi; Vse. Najpogostejša raziskava na Instagramu je običajna raziskava občinstva: kdo so ti ljudje in, kar je najpomembneje, povezanost teh ljudi z drugimi družbenimi omrežji. Poiščite profil te osebe na Vkontakte in Facebook, da izračunate njegovo starost in tako naprej.
  • Vseh ostalih še ni treba prevzeti – preprosto zato, ker ni strank. Glede jezika: imamo ruščino, angleščino, španščino, vendar se še vedno uporablja izključno za znamke iz Rusije; no, ali podjetja, ki jih pripeljejo iz Rusije.
  • Vsak dan anketiramo ljudi v veliko, veliko, veliko niti: podatke zbiramo prek spleta in te kazalnike posodabljamo z uporabo API-ja. V 2-3 dneh lahko greste skozi celoten »VKontakte«, skozi njih; V približno enem tednu lahko pregledate celoten Facebook in ugotovite, kdo je kaj posodobil in kaj ne. In potem te ljudi znova sestavite ločeno: kaj točno se je spremenilo, zapišite celotno zgodbo. Po mojih izkušnjah se zelo redko zgodi, da je bil nečiji stari profil v družbenem omrežju uporabljen za kakršne koli resnične poslovne namene. To je bil čas, ko se je prijavil en politik, njegova naloga pa je bila razumeti, kakšni ljudje prihajajo v štab, kdo so bili ti ljudje pred 6-8 meseci (ali so izbrisali svoj profil, v resnici pa so prispele glasovnice za drugega kandidata). pokvariti).

    In nekajkrat - osebne zgodbe, ko so bile fotografije nekoga objavljene v javni domeni. Treba je bilo poiskati povezave ipd. Žal je škoda, a na sodišču ne moremo pričati, ker je naša baza pravno nelikvidna.

  • Shramba MongoDB je moja najljubša.

Družbena omrežja se poskušajo boriti proti zbiranju podatkov

  • Običajno oglaševalcem naložimo samo seznam teh računov, nato pa uporabijo standardnega ... Se pravi, na družbenih omrežjih, na VKontakte lahko določite seznam teh ljudi.

    Toda Facebook uporablja kupljene piškotke. Sami ne delamo s piškotki, vendar je bilo več zgodb, ko je oglaševalec sam dal nekaterim ljudem, smo komunicirali z njimi - imajo ta omrežja, z dražljivimi, nedražljivimi oglasi, temi "piškotki". Lahko ga zavežete - brez dvoma! Ampak te stvari mi niso ravno všeč, ker se mi ne zdijo zelo pristne. To je čisto po moje, kot TNS, ki "sledi" televizorjem - ni jasno, ali gledaš to televizijo ali ne, ali pomivaš posodo, ko ti je prižgana TV... In tukaj je tako. : Zelo pogosto nekaj poiščem na internetu, vendar to ne pomeni, da želim to kupiti.

  • Če uporabljate nekakšno standardno kontekstualno oglaševalsko omrežje: Imel sem več zgodb, ko smo te ljudi razložili k njim in jih poskušali z uporabo njihovih vmesnikov povezati s »piškotki« na njihovih spletnih mestih. Takih stvari pa res ne maram.

Formula za izračun plače uporabnika interneta

  • Splošna formula za povprečno plačo: to je regija, v kateri oseba živi, ​​to je kategorija podjetja, v katerem dela (to je podjetje, ki je njegov delodajalec), nato se vzame njegov položaj v tem podjetju, povprečje plača za to delovno mesto je ocenjena... Povprečna plača, vzeta iz »Head Hunter« in »Superjob« (ter obstaja več drugih virov) za dano prosto delovno mesto v dani regiji in za dani poslovni kontekst.

    Iz "Avito" in "Avto.ru" se običajno vzamejo dodatni parametri, če je oseba osvetlila telefon. Z Avito lahko vidite, kakšne stvari oseba prodaja - drage, poceni, rabljene, nerabljene. Z "Avto.ru" lahko vidite, ali ima avto - je lastnik ali ni lastnik. To je nekje manj kot 20% ljudi, ki jim je nehote nekje padel telefon in njihov račun je mogoče povezati s temi podatki.

S kakšnimi količinami upravlja podjetje za zbiranje podatkov?

  • Volumen shranjenih fotografij v petabajtih je 6,4. Trenutno ne morem natančno povedati stopnje rasti, ker smo leta 2016 začeli snemati »periskope« in šele začeli snemati video.

    Ne morem natančno reči, kdaj je bila ničla. Selili smo se iz podjetja v podjetje – vse to so dolge zgodbe. Lahko pa rečem, da VK, Facebook, Instagram in Twitter - ves ta posel (ljudje, skupine in povezave med njimi) z besedilom in vsebino - to pravzaprav ni veliko podatkov, malo verjetno je, da bi imel celo petabajt dovolj. Mislim, da je 700 gigabajtov, verjetno 800.

Ali strankam pomagate določiti trenutno nišo in kje kopati?

  • Ko stranka pride, ji predlagamo take stvari, sami pa, tako kot Google Trends, ne delamo takih stvari.
  • Imeli smo več skoraj socioloških zgodb, z volilno, predvolilno zgodovino – vse smo analizirali. Pri znamkah in ocenjevanju mnenj o znamkah se skoraj vedno vse ujema. Tukaj so volilno-volilne zgodbe - ne (z oceno, kateri kandidat naj zmaga). Ne vem, kdo se tu moti - mi ali tisti, ki razmišljajo v VTsIOM.
  • Običajno te kontrolne rezultate vzamemo od same blagovne znamke, oni pa od tovarišev, ki naročajo raziskave - telefonske raziskave, trženjske raziskave itd. Poleg tega je vse to mogoče preveriti z osnovnimi stvarmi: nekdo je odgovoril na mailing listo, nekdo je delal ankete ... Če gre za veliko blagovno znamko (Coca-Cola, na primer), ima zagotovo milijon ali dva internih pregledov strank. – to niso le komentarji na socialnih omrežjih in nekatera mnenja; To so nekakšni interni sistemi, pregledi itd.

Zakon ne “ve”, kaj so osebni podatki!

  • Analiziramo izključno odprte vire podatkov in se nikoli ne vpletamo v umazane trike. Naš model temelji na tem, da vse odprte podatke hranimo v nekih javnih podatkovnih centrih, jih najamemo drugje in jih analiziramo doma, v naših pisarnah, na naših strežnikih in ne gredo nikamor izven teritorija.

    A naša zakonodaja na področju odprtih podatkov je zelo nedorečena.

    Nimamo jasnega razumevanja, kaj so odprti podatki, kaj so osebni podatki - obstaja ta 152. zvezni zakon, a vseeno ... Kako se štejejo? Zdaj, če imam v eni bazi tvoje ime in telefonsko številko, v drugi bazi tvojo telefonsko številko in tvoj e-mail, v tretji imam recimo tvoj e-mail in tvoj avto; Zdi se, da so vse to neosebni podatki. Če vse to seštejete, se zdi, da bo po zakonu postalo osebni podatek.

    Temu se izognemo na dva načina. Prvi je, da naročniku namesti strežnik s programsko opremo, potem pa ti podatki ne gredo izven njegovega ozemlja, nato pa je naročnik odgovoren za distribucijo teh osebnih podatkov, neosebnih podatkov itd. Ali druga možnost: če je to nekakšna zgodba, kjer je treba tožiti socialno omrežje ali kaj drugega ...

    Imeli smo takšno študijo, ko smo (bile so predizbori Združene Rusije) za Lifenews zbirali račune teh tovarišev in pogledali, kakšno pornografijo imajo radi. Bilo je smešno, a vseeno. To prodajamo kot lastno, osebno mnenje, ne da bi v dokumentih zakonito razkrili, kaj smo analizirali - Enotni državni register pravnih oseb, plače, socialna omrežja; Prodamo strokovno mnenje, potem pa ob strani človeku razložimo, kaj smo analizirali in kako.
    Zgodb je bilo več, a so bile povezane z nekimi javnimi komercialnimi projekti. Na primer, imamo brezplačen neprofitni projekt za tiste, ki se vozijo z longboardi (takšne deske so dolge): naloga je bila zbiranje publikacij ljudi - ko nekdo objavi "Šel sem v park Gorky na vožnjo." In zdaj bi moral priti na zemljevid in ljudje okoli njega lahko vidijo, da je nekdo blizu njega. VK se je zelo dolgo ubadal z nami na to temo, ker jim ni bilo všeč dejstvo, da te informacije objavljamo brez dovoljenja ljudi. A potem zadeva ni prišla do sodišča, ker smo znotraj več velikih skupnosti dodali v pravila, da lahko podatke uporabljajo tretje osebe, agencije, podjetja, analize itd. Seveda ni bilo posebno etično, a vseeno.

  • Samo pravočasno smo se zavedli in začeli vsakomur prodajati svoje strokovno mnenje.

Ali sodelujete z izobraževalnimi ustanovami?

  • Sodelujemo z izobraževalnimi ustanovami, ja. Imamo celo paleto: imamo magistrski program na višji šoli, sodelujemo z drugimi univerzami. Zelo radi imamo univerze!
  • Če imaš moje kontakte mi lahko pišeš. Pa povezava do predstavitve, če koga zanima - vsi ti primeri so tam, lahko jo premaknete.
  • Če poznate telefonsko številko, pošto - to je skoraj stoodstotna možnost, nihče je ne bo odstranil. Če ni telefonske številke, je to običajno slika, če ni slike, pa leto, kraj bivanja, služba. Se pravi, po letniku, kraju bivanja in dela je skoraj vsakega vedno mogoče identificirati precej subtilno. Ampak to je spet vprašanje o nalogi.

    Imamo recimo stranko, ki prodaja internetno televizijo. Nekdo je od njih kupil naročnino na te "Igre prestolov", naloga pa je, da s svojim CRM-jem najdejo te ljudi na družbenih omrežjih in nato najdejo potencialne iz njihovega področja vpliva. Mislim samo na to, da imajo recimo ime, priimek in e-mail ... In potem je zelo težko kaj narediti. V večini primerov je ljudi mogoče najti po elektronski pošti.

  • Glede na sestavo prijateljev običajno »parčkamo« ljudi na družbenih omrežjih, vendar to ni vedno pravilno. Ne gre za to, da ni vedno prav – ne deluje vedno. Prvič, to zahteva veliko dela, saj bo treba to operacijo (ujemanje ljudi) najprej izvesti za vsakega od prijateljev - da bi razumeli, ali so prišli iz družbenih omrežij ali ne. In potem - nikomur neznano dejstvo, da imamo na VKontakte iste prijatelje, na Facebooku imamo različne prijatelje. Ne za vse, ampak zame je na primer tako; in to velja tudi za večino ljudi.

Kako se zbirajo najbolj popolni podatki?

  • Namestitev programske opreme za naročnika na njegovi strani. Na njih je nameščen strežnik, ki od nas sprejema le javne podatke, njihove osebne podatke pa obdeluje interno. S stranko se sklene NDA. To seveda ni prav, da to prenesejo na nas, vendar je pravna odgovornost naročnika - no, to je namestitev programske opreme zanj ali prenos anonimnih podatkov. A to je bilo zelo redko, saj se – pravilna ali nepravilna anonimizacija – v večini primerov izgubi odvisnost med temi ljudmi.

Kdo kupuje programsko opremo za prepoznavanje obraza?

  • Pravzaprav gremo sem, ker je naša glavna programska oprema, ki jo prodajamo, iskanje obrazov, korelacijska analiza, in jo prodajamo vladnim agencijam. In pred letom in pol smo se odločili, da bomo vse te zgodbe dali v oglaševanje, v marketing, na javni trg – tako je nastal Social Data Hub, komercialna pravna oseba. In zdaj šele prihajamo sem. Tukaj se družimo že leto in pol in poskušamo ljudem razložiti, da ljudem ni treba dajati prenosov z omembo, da jim je treba dati odgovore na vprašanja, da ni potrebe po tonaliteti. , in tako naprej. Tako da je težko reči kje...
  • (Koga mislite?) Vsem tovarišem, ki morajo iskati teroriste in pedofile.
    Takoj lahko rečem (to bo naslednje vprašanje): po naših podatkih zaradi ponovnega objavljanja ni bil zaprt noben učitelj.
  • Na VKontakte - 14%; na ​​Facebooku ni zaprtega profila kot takega (obstaja zaprt seznam prijateljev in tako naprej). In najbolj zanimivo je, da sem pravkar napisal sporočilo - zdaj bodo šteli in rekli.

Ne objavljajte nečesa, česar se boste sramovali!

  • Na družbenih omrežjih ne objavljajte ničesar, česar bi se sramovali – osebno temu sledim. Čeprav sem imela veliko osebnih, saj prisegam na facebook. No, bilo je in nekaj je bilo treba narediti ... Ne objavljajte ničesar, kar bi bilo sramotno! Če boste kasneje delali kje v javni zbornici, ja, bolje je, da ne komentirate. Če tega ne boste storili, na splošno nikogar ne zanima. Lahko vam samo zagotovim, da nihče ne bere vaše osebne korespondence in vse to gradi celotno zgodbo ...

    Vsak teden zagotovo nekdo pride do mene in reče: »No, fotografije mojega prijatelja so pricurljale na neko anonimno javno stran! pomoč! Mimogrede, nikoli ne objavljajte ničesar na anonimnih javnih straneh.

  • Za druge nadzorne sisteme ne vem - to bomo vsekakor upoštevali, da je bila omemba znamke negativna, bog naj mi oprosti ... Lahko pa rečem, da vse sorte bližnjedržavne tovarišije zanimajo samo ljudje. ki imajo več kot 5 tisoč gledalcev in njihovo javno mnenje lahko vpliva na nekoga. potem vpliva. Po mojih izkušnjah se še ni zgodilo, da bi kadrovska agencija, ki pri nas naroča ocene profila, rekla: »Kdor ima rad Navalnega, naj nikogar ne zaposluje!«

O objavi rezultatov. Koliko ljudi je zaposlenih v raziskavah?

  • Od 10 najboljših oglaševalskih podjetij jih zdaj objavlja sedem. Težko rečem: ko smo to začeli pred letom in pol ... Na vsakem področju imamo več ljudi - v bankah je več ljudi, v kadroviki je več ljudi, v oglaševanju je več ljudi. In zdaj razmišljamo, h komu se prej splača iti, za koga moramo začeti delati nekaj vmesnikov ...
  • (o številu ljudi na tržni segment) Ne več kot 25 ljudi, ker nismo nikogar posilili.
  • Na splošno se te tehnologije s trga uporabljajo, mislim, da več kot 50%. Nekateri v oglaševalskih akcijah, nekateri v nekakšni interni analitiki. Rekel bi, da ga 40 odstotkov uporablja v notranji analitiki, 50–60 % pa ga prodaja končnim blagovnim znamkam. A to je že odvisno od samih oglaševalskih podjetij. Vidite, nekateri ljudje poročajo zgolj zaradi porabljenega denarja, oglaševanja, ki so ga postavili, drugi pa pišejo, koliko ljudi so pripeljali, kakšno občinstvo ... Bi rekel, lahko pa se motim - ne res si ne predstavljam, kako delajo vsi ti tovariši. Vem samo v kvantitativnih podatkih.

Nekaj ​​oglasov 🙂

Hvala, ker ste ostali z nami. So vam všeč naši članki? Želite videti več zanimivih vsebin? Podprite nas tako, da oddate naročilo ali priporočite prijateljem, oblak VPS za razvijalce od 4.99 $, edinstven analog začetnih strežnikov, ki smo ga izumili za vas: Vsa resnica o VPS (KVM) E5-2697 v3 (6 jeder) 10 GB DDR4 480 GB SSD 1 Gbps od 19 USD ali kako deliti strežnik? (na voljo z RAID1 in RAID10, do 24 jeder in do 40 GB DDR4).

Dell R730xd dvakrat cenejši v podatkovnem centru Equinix Tier IV v Amsterdamu? Samo tukaj 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6 GHz 14C 64 GB DDR4 4 x 960 GB SSD 1 Gbps 100 TV od 199 $ na Nizozemskem! Dell R420 - 2x E5-2430 2.2 Ghz 6C 128 GB DDR3 2x960 GB SSD 1 Gbps 100 TB - od 99 $! Preberite o Kako zgraditi infrastrukturo Corp. razreda z uporabo strežnikov Dell R730xd E5-2650 v4 v vrednosti 9000 evrov za drobiž?

Vir: www.habr.com

Dodaj komentar