Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

14. märtsil 2017 esines BBDO loengus Social Data Hubi tegevjuht Arthur Khachuyan. Arthur rääkis intelligentsest monitooringust, käitumismudelite loomisest, foto- ja videosisu äratundmisest, aga ka muudest Social Data Hubi tööriistadest ja uuringutest, mis võimaldavad sihtida sihtrühmi sotsiaalvõrgustike ja Big Data tehnoloogiate abil.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Artur Khachuyan (edaspidi - AH): - Tere! Tere kõigile! Minu nimi on Arthur Khachuyan, juhin ettevõtet Social Data Hub ja me tegeleme erinevate huvitavate avatud andmeallikate, infoväljade intellektuaalsete analüüsidega ning teeme kõikvõimalikke huvitavaid uuringuid ja nii edasi.

Ja täna palusid kolleegid BBDO Groupist meil rääkida tänapäevastest tehnoloogiatest suurandmete, suurte ja mitte nii suurte reklaamide analüüsimiseks: kuidas neid kasutatakse, näidake huvitavaid näiteid. Loodan, et esitate teel küsimusi, sest mul võib hakata igav ja mitte avaldada olemust ja nii edasi, nii et ärge olge häbelik.

Tegelikult on põhisuunad, kus kunagi kasutati mingeid "peaaegu suurandmete" lahendusi, on need kõik selged - see on sihtrühma sihtimine, analüüs, mingi analüütilise turundusuuringu läbiviimine. Kuid alati on huvitav, milliseid lisaandmeid on võimalik leida, milliseid lisatähendusi pärast analüüsi rakendamist leida.

Miks me vajame reklaamimiseks tehnoloogiat?

Kust me alustame? Kõige ilmsem on reklaam sotsiaalvõrgustikes. Täna võtsin selle hommikul maha: millegipärast arvab VKontakte, et peaksin just seda reklaami nägema... Kas see on hea või halb, on teine ​​küsimus. Näeme, et kuulun kindlasti ajateenijate kategooriasse:

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Kõige esimene ja kõige huvitavam asi, mida võib võtta kui tehnoloogilist lahendust... Esimene asi, mida tahtsin enne alustamist otsustada, on defineerida mõisted: mis on avaandmed ja mis on suurandmed? Sest kõigil inimestel on selles asjas oma arusaam ja ma ei taha oma tingimusi kellelegi peale suruda, aga... Ikka selleks, et lahknevusi ei tekiks.

Isiklikult arvan, et avaandmed on kõik, milleni jõuan ilma sisselogimise või paroolita. See on avatud profiil sotsiaalvõrgustikes, need on otsingutulemused, need on avatud registrid jne. Suurandmed, minu enda arusaamise järgi, näen seda nii: kui see on andmeplaat, on see miljard rida, kui see on mingisugune failide salvestusruumi, see on kuskil petabaidi andmeid. Ülejäänud pole minu terminoloogias big data, vaid midagi taolist.

Kõrge täpsusega profileerimine ja profiiliskoorimine

Lähme järjekorras. Kõige esimene ja kõige huvitavam asi, mille saate avatud andmeallikate analüüsimisel välja mõelda, on ülitäpne profiilide koostamine ja profiilide hindamine. Mis see on? See on lugu, kus teie suhtlusvõrgustiku konto võib ennustada mitte ainult seda, kes te olete, mitte ainult teie huvisid.

Nüüd aga saate erinevaid allikaid kombineerides aru, milline on teie keskmine palgatase, kui palju teie korter maksab ja kus see asub. Ja kõiki neid andmeid saab olemasolevate vahendite abil sõna otseses mõttes kasutada. Näiteks kui võtate oma konto sotsiaalvõrgustikus, vaadake näiteks, kus te elate, kus töötate; mõista, millises ärivaldkonnas ettevõte, kus töötate, on; laadi alla sarnased vabad töökohad HH-st ja “Superjobist”, kui oled analüütik, juht vms; vaadake, kus te elate (baas, ütleme CIAN), saage aru, kui palju maksab selles kohas kodu rentimine, kui palju maksab selles kohas kodu ostmine, ennustage ligikaudu, kui palju teenite. Lisaks saate oma suhtlusvõrgustikke kasutades aru, kui palju reisite, kus viibite ja kui lojaalne oma tööandjale olete.

Sellest tulenevalt saame nii suure hulga mõõdikute põhjal teha kõike, mida tahame. Saame teile tutvustada toodet, mis teid huvitab. Kas kujutate ette veebipoodi? Lähete sinna - see veebipood püüab teie kontot sotsiaalvõrgustikus ja ütleb teile: "Maša, sa läksid just oma poiss-sõbrast lahku, siin on teile mõned tooted." See pole lähitulevik...

Kuidas määratakse inimese geolokatsioon?

Vastused publiku küsimustele:

  • Tavaliselt loetakse 80% kõikidest registreerimistest täpseks elukohaks. Aga inimestel, kes kuhugi sisse ei registreeri, on mitu võimalust: kas check-in või geolokatsioon või see on postituste ja publikatsioonide analüüs kogu perioodi kohta, mil inimene midagi kirjutas... Ja kuskil kuvatakse midagi, näiteks "Ma tahan osta Akademicheskaya lähedal jalutuskäru" või "Ma nägin hiljuti siin seinal inetut grafitit". See tähendab, et ligi 80% inimeste puhul saab sotsiaalvõrgustikest kogutavate andmete või metaandmete abil kindlaks määrata nende geograafilise asukoha, töökoha ja elukoha.

    See on jällegi postituste analüüs. Kõige lihtsamas mõttes on see sotsiaalvõrgustike sisseregistreerimiste ja geograafiliste asukohtade analüüs, mis ei kustuta jpeg-metaandmeid (sellest saate midagi välja mõelda). Ülejäänud inimeste jaoks on need aga tavaliselt tekstisaated: kas inimene “särab” oma asukohta, kui ta millestki kirjutab, või “särab” oma telefoni, mille abil leiate osa tema reklaamidest Avitost või tema kontolt lehelt " Auto RU". Nende andmete põhjal saate kombineerida (näiteks "Müün auto Majakovskaja lähedal") ja seda ligikaudu eeldada.

  • Tavaliselt postitavad inimesed seda sotsiaalmeediasse. Töötame ainult avatud allikatega ja siin räägime eranditult avatud allikatest. Tavaliselt avaldavad nad kuulutusi, st kuuekümnel protsendil juhtudest on kõige levinum lugu, kui inimesed oma hetke mobiiltelefoni numbrit “näitasid”, millegi müügikuulutused. Kas mõnes grupis inimene kirjutab (“Ma müün seal seda või teist”) või läheb kuhugi.

    Jah! Tavaliselt kommenteerivad nad nii: “Vasta mulle või saada SMS, helista minu numbrile. Seda juhtub väga sageli inimestega, kes midagi müüvad, sotsiaalvõrgustikest midagi ostavad, kellegagi suhtlevad... Seega saate seda numbrit kasutades siduda sellega tema profiili CIANis, kui ta on kunagi midagi avaldanud, või jällegi Avito. Need on lihtsalt kõige populaarsemad, parimad allikad, sellest tuleb edaspidi – need on Avito, CIAN ja nii edasi.

  • See viitab veebipoele. Järgmine on näotuvastuse ja profiilide sobitamise tehnoloogia (me räägime sellest). Puhtalt teoreetiliselt saab seda rakendada võrguühenduseta poe puhul. Ja üleüldse on mu suur unistus, et tänavabännerite ilmumisel kaamerast mööda minnes see näo “lõksu kinni” tõmbaks. Kuid see juhtum on seadusega keelatud, kuna see on privaatsuse rikkumine. Loodan, et see juhtub varem või hiljem.
  • Isiklikust kogemusest. Väga sageli, kui inimene sulle midagi kirjutab, lähtud sa tema elust mõnest faktist, mida sa justkui ei peaks teadma... Inimesed tunnevad enamasti hirmu. Aga! Värske statistika põhjal on sotsiaalvõrgustikes suletud kontode arv vähenenud 14%. Võltsimiste arv kasvab, avatud kontode arv kasvab – inimesed liiguvad üha enam avatuse poole. Arvan, et 3-4 aasta pärast lakkavad nad nii tugevalt reageerimast sellele, et keegi teab nende kohta infot, mida ta potentsiaalselt teadma ei peaks. Aga tegelikult on seda tema seina vaadates väga lihtne saada.

Mida saab võtta avatud allikatest?

Seal on ligikaudne nimekiri asjadest, mida saab avatud allikatest üsna suure usaldusväärsusega mõista. Tegelikult on erinevaid mõõdikuid veelgi rohkem; see sõltub sellise uuringu tellijast. On mõni personaliagentuur, kes tunneb huvi, kas sa sõimad sotsiaalvõrgustikes või kuskil avalikus ruumis. Kedagi huvitab, kas teile meeldivad Navalnõi väljaanded või vastupidi Ühtse Venemaa väljaanded või mingi pornograafiline sisu - selliseid asju juhtub üsna sageli.

Peamised neist on pereväärtused, korteri, kodu orienteeruv maksumus, auto otsimine jne. Selle põhjal saab inimesi jagada sotsiaalsetesse rühmadesse. Need on Moskva Tinderi kasutajad, kes nad on (nende Facebooki kontodelt leitud piltide järgi); huvide alusel jagunevad nad erinevatesse sotsiaalsetesse rühmadesse:

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Kui liigume reklaamile lähemale, siis oleme tasapisi eemaldunud tavapärasest reklaami sihtimisest, kui valite VKontakte'is, et olete huvitatud 18-aastastest meestest, kes on liitunud teatud rühmadega. Mul on järgmine pilt, ma näitan teile nüüd:

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Põhimõte on see, et enamik praegustest teenustest, mis analüüsivad põhimõtteliselt sotsiaalvõrgustikke analüüsivaid inimesi, tegelevad huvide analüüsimisega... Esimese asjana tuleb inimestele pähe oma tellijate tippgruppide analüüsimine. Võib-olla see mõne jaoks töötab, kuid isiklikult arvan, et see on põhimõtteliselt vale. Miks?

Teie meeldimised kogutakse ja analüüsitakse

Nüüd võtke telefonid, vaadake oma parimaid gruppe - kindlasti on üle 50% gruppe, mille olete juba unustanud, see on mingi sisu, mis teie jaoks tegelikult ei puutu. Te ei tarbi seda üldse, kuid süsteem jälgib teid siiski nende järgi: kas olete tellinud retseptid, mõned populaarsed grupid. See tähendab, et rikute teie profiili analüüsivat süsteemi ja teie huvid ei ole õigustatud.

Liigume edasi... Mis seal on? Me eeldame, mida teised inimesed teevad. Meie arvates on kõige adekvaatsem viis kasutajate huvide hindamiseks meeldimised. Näiteks VKontakte'is pole meeldimiste voogu ja inimesed arvavad, et keegi ei tea, mis neile meeldib. Jah, osa meeldimisi tutvustatakse Instagramis, midagi näeme ka Facebookis, aga suurem osa teatud gruppide sisust ei edasta seda ühises voos ning inimesed elavad kaasa ja arvavad, et keegi ei tea, mis neile meeldib.

Ja kogudes teatud sisu, mis meid huvitab, kogudes neid postitusi, kogudes neid meeldimisi, seejärel kontrollides seda inimest selle andmebaasi abil, saame suure täpsusega kindlaks teha, kes ta on, milline on tema saatus, mis teda huvitab. Asetage ta täpselt teatud sotsiaalsesse gruppi ja suhtlege temaga.

Auto ostmine muudab käitumist

Mul on selline näide. Teen kohe reservatsiooni, et minu näited on peaaegu reklaami- ja turunduslähedased, sest teate, enamik juhtumeid on kaitstud NDA-ga ja nii edasi. Aga palju huvitavat saab ikka olema. Niisiis, lugu nende inimestega: need on mehed, kes ostsid auto aastatel 2010–2015. Seda, kuidas nende sotsiaalne käitumine veebis on muutunud, näitab värv. Tüdrukute protsent tellijate hulgas on muutunud, tellisin “poisilikke” avalikke lehti, leidsin püsiva seksuaalpartneri...

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Kogu see asi on jaotatud automargi ja inimeste arvu järgi. Siit saate teha palju huvitavaid järeldusi inimeste käitumise ja selle toimimise kohta. Võin öelda, et Porsche Cayenne ja istutatud Priora on ligitõmbava publiku arvu poolest peaaegu identsed. Selle publiku kvaliteet ja käitumine on erinevad, kuid kvantiteet on ligikaudu sama. Siit saate teha järelduse, mida soovite, teie turule lähemal. Kui müüte Audi, teete loosungi "Ostke Audi ja põgenege oma vanemate juurest!" ja nii edasi.

Jah, see on naljakas näide sellest, et inimeste käitumine meeldimiste analüüsi põhjal, millisesse gruppi nad liiguvad, mis sisu analüüsivad - peaaegu 100% tõenäosusega teeb selgeks, kes sa oled. Sest kui teil pole juurdepääsu võrguliiklusele ja te ei loe isiklikke sõnumeid, näitavad meeldimised teile alati, kes see inimene on - rase naine, ema, sõjaväelane, politseinik. Ja teile kui inimesele, kes oskab reklaamida, on see suur tabamus.

Vastused publiku küsimustele:

  • Iga veerg näitab selles autos viibivate inimeste arvu; kuidas nende käitumismustrid on muutunud. Vaadake: Porsche Cayenne'i ostnud inimesi - umbes 550 inimest (kollane), tüdrukute osakaal tellijate hulgas on suurenenud.
  • Valimi moodustavad sotsiaalvõrgustike “Vkontakte”, “Facebook”, “Instagram” kasutajad aastatel 2010–2015. Ainus selgitus: siin on valitud autod, mida saab teatud tööriistade abil fotodel tuvastada enam kui 80% täpsusega.
  • Teatud aja jooksul tema auto (noh, et mitte tema, selle jätame sotsiaalvõrgustike hooleks)... Teatud aja jooksul pildistati inimest pidevalt autoga, oli sellega, väljaanded. olid erinevad, fotod olid erinevate nurkade alt jne. Siis tuleb pilt, millised inimesed milliste autodega pildistavad ja... Jah, see on teine ​​küsimus - usaldus sotsiaalvõrgustike andmete vastu.
  • Kuna me selle välja tõime, ei ole sotsiaalmeedia andmed kahjuks alati õiged. Inimesed ei ole alati valmis oma teavet avaldama. Mina isiklikult viisin läbi sellise uuringu: võrdlesin Moskva ülikoolide lõpetajate arvu sotsiaalvõrgustikes registreeritud inimeste arvuga. Keskmiselt on sotsiaalvõrgustikes registreeritud 60% rohkem inimesi - Moskva Riikliku Ülikooli lõpetajaid teatud erialadel teatud aastal - kui tegelikult on. Nii et jah – siin on loomulikult protsent vigu ja keegi ei varja seda. Siin võtame lihtsalt aluseks need autod, mida on võimalik tuvastada enam kui 80% tõenäosusega.

Modellikoolituse allikate loetelu

Siin on näidisloend allikatest, mida saab kasutada, et määrata suure kindlusega inimese sotsiaalne profiil, kes ta on.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Võtame profiili sotsiaalvõrgustikest, CIANist - korteri maksumus on ligikaudu, "Head-Hunter", "Superjob" - see on antud inimese keskmine palk. Loodan, et siin ei ole ühtegi Head Hunteri esindajat, sest nende arvates ei ole väga hea neid andmeid neilt võtta. See on aga teatud piirkondade keskmine palk teatud tüüpi tegevuste eest vabade töökohtade puhul.

“Avito”, “Avto.ru”: väga sageli on inimestel, kui nende telefon põleb, kindlasti (paljudel juhtudel) vähemalt midagi “Avitos” või “Avto.ru”-s või mõnel teisel saidil, kust saate aru, kes nad on. Kui sellel telefoninumbril müüdi käru või auto... Rosstat ja Ühtne Riiklik Juriidiliste Isikute register on ikka rohkem registrid, mille abil saab tööd andva ettevõtte järjestada - mingi valemi järgi, mudeli järgi, iga inimene saab määrata (selle inimese raha saab ligikaudselt määrata jne).

Tinder aitab koguda andmeid inimeste olukorra kohta

Lisaks on selline huvitav asi (alternatiivselt on see uuringus väga naljakas) - see on jällegi Moskva Tinderi andmete kogumine, kasutades selle Tinderi jaoks roboteid. Määrati kaugus inimesteni ja seejärel määrati nende ligikaudne asukoht.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Selle uuringu eesmärk oli määrata Tinderi kontode arv valitsusasutuste territooriumil – duumas, prokuratuuris jne. Aga sina kui reklaamija võid ette kujutada mida iganes sa tahad: see võib olla näiteks Starbucks või keegi teine... See tähendab, kui palju inimesi Tinderis sinu käest kohvi joovad, midagi tellivad, on poodides Selle geograafilise asukoha kohta: seda saab teha mis tahes teenusega.

Vastus publiku küsimusele:

  • Tinder? Sa ei tea? Tinder on kohtingurakendus, kus vaatate fotosid (vasak-parem) ja see rakendus näitab vahemaad inimeseni. Kui leiate kauguse selle inimeseni kolmest erinevast punktist, saate asukoha määrata ligikaudu (+ 5-7 meetrit). Sel juhul ei ole prokuratuuri või riigiduuma territooriumil määramine nii keeruline. Aga jällegi, see võib olla teie pood, see võib olla ükskõik milline.

Näiteks oli meil ammu-ammu selline juhtum (mitte uuring), kui saime ühelt mobiilsideoperaatorilt andmed liiklustiheduse kohta, andmed mobiilsidepunktide liikumistiheduse kohta ja kogu see teave pandi peale. maanteedel asuvate stendide koordinaatidel . Ja mobiilsideoperaatori ülesanne on kindlaks teha, kui palju inimesi umbes möödub ja võiks seda reklaamtahvlit näha.

Kui siin on reklaamtahvlite spetsialiste, siis võib öelda: üliusaldusväärselt on võimatu aru saada - keegi tuleb, keegi ei vaadanud, keegi vaatas... Sellegipoolest on see näide sellest, kuidas on 20 miljardit polügooni need Moskvas, kus on nende inimeste tihedus igal tunnil teatud marsruutidel... Näete igal hetkel, millest need inimesed möödusid, ja umbkaudu hinnata reisijatevoogu.

Vastus publiku küsimusele:

  • Keegi ei anna selliseid andmeid. Tegime ühe operaatori jaoks sellise uuringu, see on eranditult sisemine lugu, nii et kahjuks pole seda piltidena esitatud. Kuid sageli pole suurtel reklaamiagentuuridel probleeme operaatoriga ühenduse võtmisega. Vähemalt Moskvas on palju pretsedente, kui näiteks kindlustusfirmad pöörduvad selliste ettevõtete poole nagu GetTaxi, kes annavad isikupäratuid andmeid juhi vanuse ja sõiduviisi kohta (hea - halb, hoolimatu - ei), et ennustada. poliitikad ja nii edasi. Kõik vaevlevad sellega, aga mingil sisemisel tasandil anonüümsete andmete esitamine – arvan, et kellelgi pole sellist probleemi.

Kujutise ja mustri tuvastamine

Lase käia. Minu lemmik on pildituvastus. Seal on väike tükk inimeste otsimisest nägude järgi, kuid me enamasti seda osa ei võta. Me võtame konkreetselt pildituvastuse ja selle kindlaksmääramise, mis sellel pildil on – auto mark, värv jne.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Mul on selline naljakas näide:

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Seal oli selline uuring tätoveeringute otsimise kohta erinevates sotsiaalvõrgustikes. Järelikult saab sama rakendada iga kaubamärgi, mis tahes visuaalse pildi, peaaegu iga visuaalse pildi kohta. On neid, mida ei saa usaldusväärselt määrata (me ei võta neid).

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Siin on minu lemmik. Automargid pöörduvad selle ülesande poole üsna sageli, sest nende ülesanne on näiteks leida mõne BMW X6 kõik omanikud, aru saada, kes nad on, kuidas nad on omavahel seotud, mis neid huvitab jne. See on seotud küsimusega, milliste autodega inimesed sotsiaalvõrgustikes pilte teevad.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Filtreerimist ei olnud siin üldse: objekt oli nende, auto polnud nende oma; See on lihtsalt autode rike – vanus ja nii edasi. Kuid visuaalset pildituvastust kasutatakse üsna sageli: see on rasedate naiste otsimine ja brändide logode otsimine mingis massimeedias (kes mida postitab).

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Minu lemmikkohver (mida kasutavad erinevad restoranid): milliseid rulle sotsiaalvõrgustikku postitatakse. See on naljakas asi, kuid tegelikult võimaldab see teil mõista palju huvitavat, esiteks teie enda klientide kohta: kes teie juurde tulid ja miks nad seda tegid. Sest pole ju saladus, et sushibaarides pildistavad enamus inimesi (ma ei ütleks “tüdrukud”), et end sisse registreerida, midagi pildistada jne.

Bränd saab seda ära kasutada. Brändi huvitab, milliseid tooteid ta ilusaks pildistamiseks ja postitamiseks vajab, millised inimesed sinna tulid. Seda saab teha peaaegu kõigega, alates toidust.

Video mustrituvastus

Vastus publiku küsimusele:

  • Mitte videol. Meil on see testrežiimis. Proovisime seda tehnoloogiat, aga tuleb välja, et... See tunneb videoga kõik üsna hästi ära, aga rakendust pole me sellele kuskilt leidnud. Hüvasti. Peale selle, et analüüsida, kui palju ja millised videoblogijad kuskil räägivad... Oli selline uuring. Kui palju nende nägusid kohtuvad, kui sageli. Kuid kaubamärgid pole veel aru saanud, kust seda välja mõelda. Võib-olla kunagi see tuleb.

Jällegi, see on toit, see võib olla rasedad naised, mehed (mitte rasedad), autod - kõik.

Võimalusena oli ühe meediaväljaande jaoks uusaastaõpe. Ka reklaamist kaugel, aga siiski. Sellist toitu paastusid inimesed aastavahetuseks:

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Siin on jaotatud ka vanuse järgi. Näha on selline korrelatsioon, et noored tellivad enamasti toitu, täiskasvanud teevad enamasti traditsioonilise laua. See on naljakas asi, kuid kujutades seda brändi omanikuna, saate hinnata paljusid asju: kes ja kuidas teie toodet käsitleb, mida nad sellest kirjutavad. Sageli ei mainita tekstis alati kaubamärki ennast ning traditsioonilised analüütilised jälgimissüsteemid ei suuda alati seda kaubamärgi mainimist mõista ega leida ainult seetõttu, et seda tekstis ei mainita. Või on tekst valesti kirjutatud, pole räsimärke ega midagi.

Fotod on nähtavad. Fotograafia abil saate aru, kas see on kaadri keskobjekt või mitte. Siis näete, mida see inimene kirjutas. Kuid enamasti kasutatakse seda potentsiaalsete vaatajaskondade otsimiseks, kes on teatud autodega sõitnud jne. Ja siis teeme nende autodega palju huvitavat.

Bote õpetatakse inimesi jäljendama

Inimeste loendamise kasutamiseks oli ka selline võimalus:

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Inimeste võrdlemiseks on võimalus, kui peate mõne foto abil inimesi leidma, mõistma nende sotsiaalset profiili, kes nad on. Jälle pöördume tagasi küsimuse juurde, et kui meil on võrguühenduseta poes kaamera, siis on see üsna hea viis aru saada, kes teie juurde tulevad, kes need inimesed on, mis neid huvitab, mis ajendas neid teie juurde tulema. .

Edasi tuleb kõige huvitavam: kui kogume sotsiaalvõrgustikes nende kontosid, saame aru, kes need inimesed on, mis neid huvitab, saame (võimalusena) teha nende inimestega sarnase roboti; see bot hakkab elama nagu need inimesed ja analüüsima, milliseid reklaame ta erinevates sotsiaalvõrgustikes näeb. See võimaldab teil täpselt mõista, millised kaubamärgid on sellele inimesele suunatud. See on ka üsna tavaline lugu, kui peate analüüsima, kes see inimene on ja millised huvid tal on, vaid ka seda, millist reklaami teie potentsiaalsed konkurendid või teised huvilised peaksid sihtima.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Seoste analüüs sotsiaalvõrgustikes

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Järgmine huvitav asi on inimestevaheliste suhete analüüs. Tegelikult on võrguühenduste analüüs, need võrgugraafikud - selles pole natuke, midagi uut, kõik teavad seda.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Kuid kõige huvitavam on rakendus reklaamiülesannetele. See on inimeste otsing, kes määravad suundumusi, see on inimeste otsing, kes levitavad teavet teatud kriteeriumide alusel selles võrgustikus. Oletame, et oleme huvitatud teatud BMW mudeli samadest omanikest. Neid kõiki kokku tuues leiame need, kes avalikku arvamust kontrollivad. Need ei pruugi olla autoblogijad ja nii edasi. Tavaliselt on need lihtsad seltsimehed, kes istuvad erinevatel avalikel lehtedel, tunnevad huvi mingist sisust ja suudavad väga lühikese aja jooksul meelitada teie brändi või kellegi teile huvipakkuva isiku sellesse vastutusvaldkonda, huvi.

Siin on selline näide. Meil on mõned potentsiaalsed inimesed, inimestevahelised sidemed. Siin on oranžid inimesed, väikesed täpid on ühised rühmad, ühised sõbrad.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Kui kõik need seosed nende vahel kokku koguda, siis on väga selgelt näha, et on inimesi, kellel on suur hulk ühiseid gruppe, ühiseid sõpru, nad on seal omavahel... Ja kui see sama visualiseerimine huvide järgi gruppidesse jagada, sisu järgi, mida levitavad, kui palju omavahel suhtlevad... Siit on näha, et eelmine pilt sai selline:

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Siin eristuvad rühmad selgelt värvi järgi. Antud juhul on tegemist meie Kõrgema Majanduskooli magistrantidega. Siin on näha, et lillad/sinised on need, kes armastavad Transparency Internationali, Open Russia ja Hodorkovski avalikke lehti. All vasakul on rohelised, need, kes armastavad Ühtset Venemaad.

Näete, et eelmine pilt oli selline (need on lihtsalt inimestevahelised sidemed), kuid on selgelt piiritletud. See tähendab, et kõik inimesed on alati üksteisega seotud, neil on samad huvid, nad on üksteisega sõbrad. Ühed on üleval, teised all ja veel mõned seltsimehed seal. Ja kui kõiki neid väikeseid alamgraafikuid teiste parameetritega eraldi visualiseerida ja vaadata sisu levitamise kiirust (jämedalt öeldes, kes mida seal uuesti postitab), võib igast osast leida ühe või kaks inimest, kes hoiavad avalikku arvamust alati enda käes, millega suhelda, paludes saata mingi postitus või midagi muud - vastuse saad kogu sellelt huvitavalt publikult.

Mul on veel üks selline näide. Samuti graafik: need on näiteks sotsiaalvõrgustikest leitud BBDO Grupi töötajad. Tundub ebahuvitav, suur, roheline, nendevahelised seosed...

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Aga mul on variant, kus rühmad on nende vahele juba ehitatud. Siis, kui kedagi huvitab, siis on interaktiivne versioon - saab klõpsata ja vaadata.

Üleval paremal on need, kes armastavad Putinit. Siin on lillad disainerid; need, kes on huvitatud disainist, millestki huvitavast jne. Siin on valged asjad juhtkond (ilmselt, nagu ma aru saan); Need on inimesed, kes üldiselt ei ole kuidagi seotud, vaid töötavad ligikaudu samadel ametikohtadel. Ülejäänu on nende ühised rühmad, sidemed jne.

Brändid ei vaja blogijaid, vaid arvamusliidreid

Me võtame need inimesed ja leiame - siis reklaamiagentuur, reklaamifirma otsustab ise: võib sellele inimesele raha anda, et ta kuidagi selle sisuga suhtleks, millegi muuga või suunaks neile oma konkreetse reklaamikampaania. Seda kasutatakse ka üsna sageli, eriti praegu, sest kõik kaubamärgid tahavad blogijatega koostööd teha, nad tahavad, et nende sisu reklaamitaks, kuid reklaamiagentuurid ei taha eriti ühendust võtta (noh, see juhtub).

Ja tegelik väljapääs sellest olukorrast on leida inimesi, kes ei ole blogijad, mitte ilublogijad, vaid näiteks selle kaubamärgiga suhtlevad tõelised olendid, kes võivad kirjutada mõnele armetu avalikule lehele “Mail.ru Answers”, saada teatud arv vaatamisi. Need inimesed, kes on selle inimese sisust pidevalt huvitatud, levitavad kogu asja ja bränd saab oma osaluse.

Teine võimalus sellise tehnoloogia kasutamiseks on praegu üsna asjakohane - robotite otsimine, minu lemmik. See on teie konkurentide mainerisk ja võimalus välja rookida ebaolulised inimesed reklaamikampaaniast ja kõigest muust (kommentaaride kustutamine ja inimestevaheliste seoste otsimine). Mul on selline näide, see on ka suur ja interaktiivne - saate seda liigutada. Need on Lentachi kogukonnas kommentaare kirjutanud inimeste sidemed.

See näide on selleks, et mõistaksite, kui hästi ja hästi nähtavad on robotid; ja selleks ei pea teil olema tehnilisi teadmisi. See tähendab, et “Lentach” avaldas postituse FBK uurimise kohta Dmitri Medvedevi kohta ja teatud inimesed hakkasid kommentaare kirjutama. Kogusime kokku kõik kommentaare kirjutanud inimesed – need inimesed on rohelised. Nüüd liigutan seda:

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Inimesed on rohelised (kes kommentaarid kirjutasid). Nad on siin, nad on siin. Sinised täpid nende vahel on nende ühised rühmad, kollased täpid on nende ühised tellijad, sõbrad jne. Suurem osa inimesi on omavahel seotud. Sest olenemata kolme, nelja, viie käepigistuse teooriast, on kõik inimesed sotsiaalvõrgustikes üksteisega seotud. Pole olemas inimesi, kes oleksid üksteisest eraldatud. Isegi minu sotsiaalselt foobsed sõbrad, kes kasutavad VKontaktet ainult videote vaatamiseks, on endiselt tellinud mõned meiega samad avalikud lehed.

Navalnõi kasutab ka roboteid. Kõigil on robotid

Suurem osa inimestest (siin see on, siin) on omavahel seotud. Kuid seal on nii väike seltskond, kes on üksteisega eranditult sõbrad. Siin nad on, väikesed rohelised, siin on nende ühised sõbrad ja rühmad. Siin kukkusid nad isegi eraldi maha:

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Ja õnneliku juhuse läbi kirjutasid just need inimesed selle postituse alla: "Navalnõil pole tõendeid" ja nii edasi, kirjutasid samad kommentaarid. Muidugi ei julge ma järeldusi teha. Kuid sellegipoolest oli mul Facebookis veel üks postitus, kui Lebedevi ja Navalnõi vahel oli debatt, analüüsisin kommentaare samamoodi: selgus, et kõik inimesed, kes kirjutasid “Lebedev on pask”, ei olnud sotsiaalvõrgustikus käinud. võrkudes hiljuti neli kuud, ei tellinud ühtegi avalikku lehte, läks järsku selle konkreetse postituse juurde, kirjutas täpselt selle kommentaari ja lahkus. Jällegi, siit on võimatu järeldusi teha, kuid keegi Navalnõi meeskonnast kirjutas mulle kommentaari, et nad ei kasuta roboteid. No okei!

Reklaamile lähemal, brändile lähemal. Kõigil on nüüd robotid! Meil on need olemas, meie konkurentidel ja teistel. Need tuleb välja visata või jätta hästi elama; Selliste andmete (osutab eelmisele slaidile) põhjal viige need täiuslikkuseni, et need näeksid välja nagu päris inimesed ja alles siis kasutage neid. Kuigi robotite kasutamine on halb! Sellegipoolest üsna tavaline lugu...

Automaatrežiimis võimaldab selline asi oma analüüsist välja filtreerida inimesed, kes ei ole analüüsi jaoks olulised, inimesi, kes ei peaks valimisse kuuluma, ei tohiks sellesse uuringusse kaasata. Väga sageli kasutatud. Pealegi, kõik autoomanikud ei oma autosid. Vahel huvitab inimesi ainult potentsiaalselt autoga inimesi, kes istuvad mingis seltskonnas, suhtlevad kellegagi, neil on seal kindel publik.

Faktide ja arvamuste analüüs

Järgmine, mis mul on, on ka minu lemmik. See on faktide ja arvamuste analüüs.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Tänapäeval teavad kõik, kuidas oma kaubamärki erinevates allikates mainida. Selles pole saladust. Ja tundub, et kõik oskavad tonaalsust arvutada... Kuigi isiklikult arvan, et tonaalsuse mõõdik ise pole eriti huvitav, sest kui sa tuled ja ütled kliendile: “Mees, sul on 37% neutraalne,” ja ta ütleb nii. , “Vau! Lahe!" Seetõttu oleks huvitavam liikuda veidi kaugemale: sentimentide hindamisest kuni nende arvamuste hindamiseni, mida nad teie toote kohta ütlevad.

Ja see on ka väga huvitav asi, sest... Mina isiklikult usun, et põhimõtteliselt ei saa olla neutraalseid sõnumeid, sest kui inimene midagi avalikus ruumis kirjutab, on see sõnum kuidagi värviline. Ma isiklikult pole kunagi näinud neutraalset sõnumit, mis mainiks kaubamärki. Tavaliselt on see mingi mustus.

Kui me võtame suure hulga neid sõnumeid (võib olla miljoneid, 10 miljonit), tõstame igast sõnumist välja põhiidee, kombineerime need, saame üsna usaldusväärselt aru, mida inimesed selle kaubamärgi kohta räägivad, mida nad arvavad. "Mulle ei meeldi pakend", "Mulle ei meeldi konsistents" ja nii edasi.

Mida arvavad inimesed Transaerost, Chupa Chupsist ja USA presidendist?

Mul on naljakas näide: see on infograafik selle kohta, mida suhtlusvõrgustiku kasutajad Transaero ettevõttega pärast selle pankrotti teeksid.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Seal on palju huvitavaid näiteid: põletage, tapage, küüditage Euroopasse, isegi 2% oli neid, kes kirjutasid - "Saada nad Süüriasse sõjalistele operatsioonidele." Naljakast asjast edasi liikudes võib see olla peaaegu iga kaubamärk – alates minu lemmikkoeratoidust kuni mõne autoni. Kellele ei meeldi pakend, kellele ei meeldi päris asjad – sellega saab alati töötada, sellega saab alati arvestada. On suur hulk näiteid, kui inimesed muutsid peaaegu oma toodete tootmist, kuna kirjutasid sotsiaalvõrgustikes, et Chupa Chups ei olnud piisavalt ümar või ei olnud piisavalt magus.

On veel üks naljakas näide. Arvake ära, millised kommentaarid ja kelle kohta?

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Millegipärast ei ole praegu arvamuste analüüs, sõnumitest väljavõetud faktide analüüs väga levinud ja ei ole väga levinud. Kuigi see tehnoloogia pole ülisalajane, puudub selles praktiliselt üldse oskusteave, sest inimeste kommentaaridest ei eelda subjekti, predikaadi väljavõtmine ja rühmitamine arvutilingvistika geeniust. Seda pole nii raske teha. Aga ma loodan, et järgmise paari aasta jooksul hakkavad inimesed seda kasutama, sest... See on lahe - see on nii automaatne tagasiside! Sa tead alati, mida nad sinu kohta räägivad. Noh, saate aru, et see tehti USA presidendi kohta.

Vastus publiku küsimusele:

  • Jah, see on Facebook inglise keeles. Need on siin tõlgitud vene keelde. See oli kuskil kirjas.

Suurandmed ja poliitilised tehnoloogiad

Tegelikult on mul palju erinevaid huvitavaid näiteid poliitikast nii Trumpi kui ka kõigi teiste kohta, aga me otsustasime neid siia mitte tuua. Kuid on üks poliitiline näide.

Need on riigiduuma valimised. Millal sa olid? Eelmisel aastal? Peaaegu poolteist aastat tagasi.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Siin on inimesed, kes suutsid kindlaks määrata oma täpse asukoha kuni teatud geopunktini, et mõista, millisesse valimisringkonda nad kuuluvad. Ja siis võeti nendest inimestest ainult need, kes oma kindlat arvamust avaldasid, kelle poolt nad hääletaksid.

Poliittehnoloogia seisukohalt pole see väga õige, sest kogu see asi vajab normaliseerimist asustustiheduse jms järgi. Sellegipoolest hääletavad siinsed sinised tead kelle poolt, punased hääletavad opositsioonikaaslaste poolt, keda muide polnud palju.

Mina isiklikult usun, et suurandmed poliittehnoloogiatesse niipea ei jõua, aga ühe võimalusena on kandidaat ka bränd. Ja see on ka mingil määral faktide ja arvamuste analüüs oma brändi kohta ja üsna huvitav asi, sest saate reaalajas aru, kes mida teeb. Ma tean BBC-st mitmeid juhtumeid, kui nad jälgisid mõnes saates sotsiaalvõrgustikke reaalajas: vastus oli selline ja selline, inimesed kirjutavad sellest, küsivad sellist ja sellist küsimust - ja see on suurepärane! Ma arvan, et seda kasutatakse varsti, sest see on kõigile huvitav.

Brändi positsioonide modelleerimine

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Järgmiseks on mul brändipositsioonide modelleerimine. Väike lühike tükk selle kohta, kuidas saate brände erinevate mõõdikute abil järjestada (mitte sotsiaalvõrgustike tellijate meeldimisi, vaid keerulisi mõõdikuid, huvi sisu vastu, mõõdikute saamiseks kulutatud aega).

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Mul on teatud põhjustel näide "pharmast". Siin on väikesed ringid sisemised, heledad – see on tekstisisu hulk, mille bränd ise loob, suur ring on foto- ja videosisu hulk, mille bränd ise loob.

Keskuse lähedus näitab, kui huvitav on sisu publikule. Seal on suur mudel, seal on hunnik igasuguseid parameetreid: meeldimised, uuesti postitused, reageerimisaeg, kes seal keskmiselt jagas... Siin on näha: seal on imeline “Kagotsel”, mis pumpab tohutult palju raha oma sisu loomiseks ja tänu sellele on nad keskusele üsna lähedal. Ja on kaasvõitlejaid, kes loovad ka ise oma sisu, aga publikut see ei huvita. See ei ole väga adekvaatne näide, sest kõik need kontod on praktiliselt surnud.

Yegor Creedit armastatakse rohkem kui Bastat

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Ülejäänud kahjuks... millest näidata... No on ka vene räppareid, valikuliselt päris firmadest.

Mis on pluss? Fakt on see, et ettevõte võib sellisesse mudelisse panna peaaegu kõike, alustades teie kaubamärgi heaks töötavate tellijate keskmisest palgast; mis tahes mudel, mis neile meeldib. Kuna iga reklaamiagentuur arvutab oma mõõdikuid erinevalt, siis brändid arvutavad oma mõõdikuid erinevalt.

Siin on ka üks - Basta, mis genereerib suurel hulgal sisu, kuid asub äärealal, sest see sisu pole pealtnäha publikule kuigi huvitav. Jällegi, ma ei julge hinnangut anda. Kuid sellegipoolest on Yegor Creed, kes on sotsiaalvõrgustike järgi peaaegu meie aja parim esineja, kuid avaldab ainult oma isiklikke fotosid. Sellegipoolest on tal palju tellijaid: neid on kuskil miljon. Ma ei mäleta täpset arvu; Mäletan, et nende inimeste kaasamisprotsent on palju suurem kui 85%, see tähendab, et miljoni tellija kohta saab ta neilt päris inimestelt 850 tuhat vastust - see on tõeline hullus. See on tõsi.

Arthur Khachuyan: "Reaalsed suured andmed reklaamis"

Vastused publiku küsimustele:

Kui kaua võttis aega räpparite analüüsi mudeli loomine?

  • Igal neist on oma sihtrühm, nende inimeste huvid on igaühe jaoks välja arvutatud... Kõik see on normaliseeritud umbes kaugusesse keskpunktist, nende radiaalne asend pole oluline (see on siin lihtsalt ilu pärast määritud, nii et nad teevad seda ei jookse kokku). Oluline on vaid ligikaudne keskuse lähedus. See on mudel, mida me kasutame. Näiteks mulle meeldib ring rohkem, mõni teeb seda mõeldes poolringina.
  • See mudel koostati kiiresti, kahe-kolme tunniga (jah, üks inimene). Siia sisestati ainult mõõdikud: mida korrutame millega, liidame kokku ja siis kuidagi normaliseerime. Oleneb mudelist. On inimesi, keda huvitab oma tellijate keskmine palk (see pole nali). Ja selleks peate leidma nende kontaktid, Avito, kõik arvutama, korrutama. Juhtub, et sellega arvestamine võtab kaua aega, aga konkreetselt see (osutab eelmisele slaidile) – siinsed parameetrid on väga lihtsad: tellijad, uuesti postitused jne. Selle valmimiseks kulus umbes kaks kuni kolm tundi. Sellest lähtuvalt värskendatakse seda asja reaalajas ja saate seda kasutada.

Nüüd tuleb lõbus osa. Olen näidetega lõpetanud, sest üksi pikalt rääkida pole huvitav. Ja ma loodan, et te esitate nüüd küsimusi ja me tegelikult liigume teemalt teemale, sest mul on selliseid näiteid, kuidas tehnoloogiaid saab kasutada ja nii edasi...

Vastused publiku küsimustele:

  • Mul oli üks ja ainuke isiklik juhtum ühe niiöelda “kasiinolähedasega”, kui sinna pandi kaamera, tunti nägusid ära jne. Tunnustatud inimeste protsent on kindlasti päris suur – nii meil kui ka konkurentidel. Aga tegelikult on see päris huvitav. Ma näen seda huvitava asjana: saate aru, kes need inimesed on, ja üsna hästi ennustada, miks nad täpselt siia tulid, mis on nende elus nii palju muutunud, et nad otsustasid kasiinosse tulla. Aga mis puudutab konkreetseid äriliike... Kui sellise asja apteeki panna, siis pole mõtet – ei oska ennustada, miks inimene apteeki tuli.

    Ülemaailmne ülesanne oli siin luua mudel, et mõista, millal inimene potentsiaalselt soovib teie kaubamärgi vastu huvi tunda, et saaksite talle reklaami teha mitte pärast seda, kui ta on midagi ostnud (nagu praegu toimub), vaid reklaamida. prognoosis”, millal see kõik juhtub. Huvitav oli sellise “kasiinolähedase” juures; osutus päris huvitav protsent neid inimesi - miks: keegi sai järsku ametikõrgendust, keegi teine ​​midagi muud - sellised huvitavad arusaamad. Aga mõne poe, jaemüügi, mingite pillide poe puhul tundub mulle, et see ei lähe väga õigeks.

Kas suurandmeid kasutatakse võrguühenduseta?

  • See oli võrguühenduseta. Peate lihtsalt täpselt, umbkaudselt aru saama, kas see mudel sobib või mitte. Jälle mulliveega... Mind huvitab tegelikult kõik, aga ma isiklikult ei saa aru, kui palju, kuidas nende inimeste profiilid, käitumine võib sõltuda sellest, millal nad pudelivett osta tahavad. Kuigi see võib tõesti tõsi olla, ma ei tea.

Kui palju on avatud sotsiaalmeedia kontosid?

  • Meil on konkreetselt 11 sotsiaalset võrgustikku - need on "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagram" ja mõned pisiasjad (võin vaadata loendit, nagu "Mail.ru" ja nii edasi) . VKontakte'is on meil kindlasti kõigi nende seltsimeeste koopia. Meil on VKontakte'is inimesi - see on 430 miljonit kõigist, kes on kunagi eksisteerinud (neist umbes 200 miljonit on pidevalt aktiivsed); on grupid, on sidemed nende inimeste vahel ja on sisu, mis meid huvitab (tekst), ja osa meediast, aga väga väike... Jämedalt öeldes vaatame seda pilti: kui seal on näod, siis meie salvestage need, kui meem on olemas, salvestame need Me ei salvesta seda, sest isegi meil poleks meediasisu salvestamiseks piisavalt.

    Seal on venekeelne Facebook. Kuskil praegu 60-80% on Odnoklassniki, paari kuu pärast saame need vist kõik lõpuni. Vene Instagram. Kõigi nende sotsiaalsete võrgustike jaoks on olemas rühmad, inimesed, nendevahelised sidemed ja tekst.

  • Umbes 400 miljonit inimest. Siin on peensus: on inimesi, kelle linna pole täpsustatud (nad on potentsiaalselt venelased / mittevenelased); Neist sotsiaalvõrgustike keskmine on 14% VKontakte'i suletud kontodest, Facebookis ma täpset arvu ei tea.
  • Me ei salvesta ka meediat Instagrami – ainult siis, kui seal on nägusid. Sellist (muud) meediasisu me ei salvesta. Tavaliselt huvitav: ainult tekst, inimestevahelised seosed; Kõik. Kõige levinum uurimus Instagramis on tavaline publiku-uuring: kes need inimesed on, ja mis kõige tähtsam, nende inimeste seos teiste sotsiaalvõrgustikega. Leidke selle inimese profiil Vkontakte'ist ja Facebookist, et arvutada tema vanust ja nii edasi.
  • Kõiki teisi pole veel vaja võtta – lihtsalt sellepärast, et kliente pole. Keele kohta: meil on vene, inglise, hispaania keel, kuid siiski kasutatakse seda ainult Venemaa kaubamärkide puhul; noh, või ettevõtted, kes neid Venemaalt toovad.
  • Intervjueerime inimesi iga päev paljudes, paljudes, paljudes lõimedes: kogume andmeid veebi kogudes ja värskendame neid näitajaid Api abil. 2-3 päeva pärast saate läbida kogu VKontakte'i, minnes need läbi; Umbes nädalaga saate läbida kogu Facebooki, saades aru, kes on mida värskendanud ja mida mitte. Ja siis pange need inimesed eraldi kokku: mis täpselt on muutunud, kirjutage kogu see lugu üles. Minu kogemuse põhjal on väga harva kellegi vana sotsiaalmeediaprofiili kasutatud mis tahes reaalsel ärilisel eesmärgil. See oli aeg, mil kandideeris üks poliitiline tegelane, kelle ülesanne oli aru saada, millised inimesed peakorterisse tulevad, kes need inimesed olid 6-8 kuud tagasi (kas nad kustutasid oma profiili, aga tegelikult saabusid sedelid mõne teise kandidaadi jaoks rikkuda).

    Ja paar korda - isiklikud lood, kui kellegi fotod avalikustati. Oli vaja leida seoseid jne. Kahjuks on kahju, kuid me ei saa kohtus tunnistusi anda, kuna meie andmebaas on juriidiliselt ebalikviidne.

  • MongoDB salvestusruum on minu lemmik.

Sotsiaalvõrgustikud püüavad võidelda andmete kogumise vastu

  • Tavaliselt laadime reklaamijatele üles ainult nende kontode loendi ja seejärel kasutavad nad tavalist... See tähendab, et sotsiaalvõrgustikes, VKontakte'is saate määrata nende inimeste loendi.

    Kuid Facebook kasutab ostetud küpsiseid. Me ise küpsistega ei tööta, kuid oli mitmeid lugusid, kui reklaamija ise andis mõnele inimesele, suhtlesime nendega - neil on need võrgud, teaseri, mitte-teaser-reklaamiga, need “küpsised”. Saate selle siduda - pole küsimust! Aga mulle see värk väga ei meeldi, sest minu meelest pole see kuigi autentne. See on puhtalt minu arust, see on nagu TNS, mis "jälgib" telereid - pole selge, kas sa vaatad seda telekat või mitte, kas sa pesed nõusid, kui telekas on sisse lülitatud... Ja siin on sama lugu : Ma väga sageli googeldan midagi Internetis, kuid see ei tähenda, et ma seda osta tahaks.

  • Kui kasutate mõnda tüüpilist kontekstuaalset reklaamivõrku: mul oli mitu lugu, kui laadisime need inimesed nende juurde ja proovisime nende liideste abil neid nende saitide küpsistega ühendada. Aga mulle sellised asjad väga ei meeldi.

Internetikasutaja palga arvutamise valem

  • Keskmise palga üldvalem: see on piirkond, kus inimene elab, see on ettevõtte kategooria, kus ta töötab (st ettevõte, mis on tema tööandja), siis võetakse tema positsioon selles ettevõttes, keskmine palk sellel ametikohal on hinnanguline... Keskmine palk, mis on võetud “Head Hunterist” ja “Superjobist” (ja on veel mitmeid allikaid) antud vaba töökoha kohta antud piirkonnas ja antud ärikontekstis.

    "Avito" ja "Avto.ru" kaudu võetakse tavaliselt lisaparameetrid, kui inimene on telefoni valgustanud. Avito abil näete, milliseid asju inimene müüb – kalleid, odavaid, kasutatud, kasutamata. "Avto.ru" abil saate vaadata, kas tal on auto - ta omab seda, ta ei oma seda. See on kuskil vähem kui 20% inimestest, kes kukutasid oma telefoni kogemata kuhugi maha ja nende kontot saab nende andmetega siduda.

Millistes mahtudes andmekogumisettevõte tegutseb?

  • Salvestatud fotode maht petabaitides on 6,4. Täpselt kasvutempot praegu öelda ei oska, sest 2016. aastal alustasime “periskoopide” salvestamisega ja alles alustasime videosalvestusega.

    Ma ei oska täpselt öelda, millal see null oli. Kolisime ettevõttest ettevõttesse – need on kõik pikad lood. Kuid võin öelda, et VK, Facebook, Instagram ja Twitter - kogu see äri (inimesed, grupid ja nendevahelised ühendused) teksti ja sisuga - pole tegelikult palju andmeid, tõenäoliselt ei piisa isegi petabaidist. Ma arvan, et see on 700 gigabaiti, tõenäoliselt 800.

Kas aitate klientidel kindlaks teha, milline on praegune nišš ja kuhu kaevata?

  • Kui klient tuleb, siis me soovitame talle selliseid asju, aga meie ise nagu Google Trends selliseid asju ei tee.
  • Meil oli mitu peaaegu sotsioloogilist lugu, valimiste, valimiseelse ajalooga – me analüüsisime seda kõike. Brändide ja kaubamärkide kohta arvamuste hindamisega on kõik peaaegu alati ühel meelel. Siin on valimiste-valimiste lood - ei (hinnanguga, milline kandidaat peaks võitma). Ma ei tea, kes siin eksib – meie või need, kes mõtlevad VTsIOM-is.
  • Tavaliselt võtame need kontrollitulemused brändilt endalt, nemad seltsimeestelt, kes tellivad uuringuid – telefoniuuringuid, turundusuuringuid jne. Lisaks saab kogu seda asja kontrollida elementaarsete asjadega: keegi vastas meililistile, keegi tegi küsitlusi... Kui tegu on suure kaubamärgiga (nt Coca-Cola), on neil kindlasti miljon-kaks klientide sisearvustust. – need pole ainult kommentaarid sotsiaalvõrgustikes ja mõned arvamused; Need on mingid sisemised süsteemid, ülevaated jne.

Seadus ei “tea”, mis on isikuandmed!

  • Analüüsime eranditult avatud andmeallikaid ega sekku kunagi räpastesse trikkidesse. Meie mudel on üles ehitatud sellele, et me salvestame kõik avaandmed mõnes avalikus andmekeskuses, rendime need kuskil mujal ja analüüsime neid kodus, kontorites, serverites ning need ei liigu väljaspool territooriumi.

    Aga meie õigusaktid avaandmete valdkonnas on väga ebamäärased.

    Meil ei ole selget arusaama sellest, mis on avaandmed, mis on isikuandmed – on see 152. föderaalseadus, kuid siiski... Kuidas neid arvestada? Nüüd, kui mul on ühes andmebaasis teie nimi ja telefoninumber, siis teises andmebaasis on teie telefoninumber ja e-post, kolmandas on näiteks teie e-post ja teie auto; Kõik see näib olevat mitteisikuandmed. Kui see kõik kokku panna, siis tundub, et seaduse järgi muutub see isikuandmeteks.

    Me saame sellest mööda kahel viisil. Esimene on installida kliendile server koos tarkvaraga ja siis ei lähe need andmed tema territooriumist kaugemale ning seejärel vastutab klient nende isikuandmete, mitteisikuandmete jms levitamise eest. Või teine ​​variant: kui see on mingi lugu, kus pead sotsiaalvõrgustiku või midagi muud kohtusse kaevama...

    Meil oli selline uuring, kui kogusime (oli Ühtse Venemaa eelvalimised) Lifenewsile nende seltsimeeste kontosid ja vaatasime, milline porno neile meeldib. See oli naljakas lugu, aga siiski. Müüme seda oma isikliku arvamusena, avaldamata dokumentides seaduslikult seda, mida analüüsisime - juriidiliste isikute ühtne riiklik register, palgad, sotsiaalvõrgustikud; Müüme ekspertarvamust ja siis kõrvalt selgitame inimesele, mida ja kuidas analüüsisime.
    Lugusid oli mitu, aga need olid seotud mõne avaliku kommertsprojektiga. Näiteks on meil üks tasuta mittetulundusprojekt neile, kes sõidavad longboardidega (sellised lauad on pikad): ülesandeks oli koguda inimeste väljaandeid – kui keegi postitab: "Käisin Gorki pargis sõitmas". Ja nüüd peaks ta kaardile pääsema ja teda ümbritsevad inimesed näevad, et keegi on tema läheduses. VK lõi meiega sellel teemal väga pikka aega pead, sest neile ei meeldinud, et me seda teavet ilma inimeste loata avaldasime. Siis aga asi kohtusse ei jõudnud, sest mitme suure kommuuni sees lisasime reeglitesse, et andmeid võivad kasutada kolmandad isikud, agentuurid, ettevõtted, analüüsid jne.. Muidugi polnud see eriti eetiline, aga siiski.

  • Saime sellest lihtsalt õigel ajal aru ja hakkasime oma ekspertarvamust kõigile müüma.

Kas teete koostööd haridusasutustega?

  • Teeme koostööd õppeasutustega jah. Meil on terve rida: meil on kõrgkoolis magistriõpe ja teeme koostööd teiste ülikoolidega. Me armastame ülikoole väga!
  • Kui teil on minu kontaktid, võite mulle kirjutada. Ja link esitlusele, kui kedagi huvitab - kõik need näited on olemas, saab liigutada.
  • Kui teate telefoninumbrit, posti - see on peaaegu sada protsenti, keegi ei eemalda seda. Kui telefoninumbrit pole, on see tavaliselt pilt, kui pilti pole, siis aasta, elukoht, töökoht. See tähendab, et aasta, elu- ja töökoha järgi saab peaaegu kõiki alati üsna peenelt tuvastada. Kuid see on jällegi ülesande küsimus.

    Meil on näiteks klient, kes müüb Interneti-televisiooni. Keegi ostis neilt nende "Troonide mängude" tellimuse ja ülesanne on kasutada nende CRM-i nende inimeste leidmiseks sotsiaalvõrgustikes ja seejärel leida potentsiaalseid inimesi nende mõjupiirkonnast. Ma mõtlen lihtsalt seda, et neil on näiteks eesnimi, perekonnanimi ja e-post... Ja siis on väga raske midagi teha. Enamasti on inimesed e-posti teel leitavad.

  • Sõprade koosseisust lähtuvalt „sobime“ tavaliselt inimesi sotsiaalvõrgustikes, kuid see pole alati õige. Asi pole selles, et see pole alati õige – see ei tööta alati. Esiteks nõuab see palju tööd, sest see operatsioon (inimeste sobitamine) tuleb kõigepealt läbi viia iga sõbra jaoks - et mõista, kas nad tulid sotsiaalvõrgustikest või mitte. Ja siis - kellelegi teadmata fakt, et VKontaktes on meil samad sõbrad, Facebookis erinevad sõbrad. Mitte kõigi jaoks, aga minu jaoks on see näiteks nii; ja see kehtib ka enamiku inimeste kohta.

Kuidas kogutakse kõige täielikumaid andmeid?

  • Tarkvara installimine kliendile tema poolel. Nendele on paigaldatud server, mis võtab meilt ainult avalikke andmeid ja töötleb nende isikuandmeid ettevõttesiseselt. Kliendiga sõlmitakse NDA. See pole muidugi väga õige, et nad selle meile üle annavad, kuid juriidiline vastutus lasub kliendil - see tähendab, et ta installib talle tarkvara või edastab anonüümseid andmeid. Kuid see oli väga haruldane, sest - õige või vale anonüümseks muutmine - enamikul juhtudel kaob nende inimestevaheline sõltuvus.

Kes ostab näotuvastustarkvara?

  • Me läheme siia tegelikult sellepärast, et meie peamine müüdav tarkvara on näootsing, korrelatsioonianalüüs ja müüme seda valitsusasutustele. Ja poolteist aastat tagasi otsustasime, et paneme kõik need lood reklaami, turundusse, avalikule turule – nii tekkis äriline juriidiline isik Social Data Hub. Ja nüüd me alles tuleme siia. Oleme siin juba poolteist aastat hänginud ja üritanud inimestele selgitada, et pole vaja anda inimestele allalaadimisi mainimisega, et neile tuleb anda küsimustele vastused, et pole vaja tonaalsust. , ja nii edasi. Seega on raske öelda, kus...
  • (Keda sa silmas pead?) Kõigile seltsimeestele, kes peavad otsima terroriste ja pedofiile.
    Võin kohe öelda (see on järgmine küsimus): meie andmetel pole ühtegi õpetajat ümberpostitamise eest vangi pandud.
  • VKontakte'is - 14%; Facebookis pole suletud profiili kui sellist (seal on suletud sõprade loend ja nii edasi). Ja kõige huvitavam on see, et kirjutasin just sõnumi – nüüd loevad ja ütlevad.

Ära postita midagi, mida sul on häbi!

  • Ärge postitage sotsiaalvõrgustikesse midagi, mis paneks teid häbenema – ma isiklikult jälgin seda. Kuigi mul oli palju isiklikke, sest ma vannun Facebookis. Noh, midagi oli ja oli teha... Ärge postitage midagi, mis oleks piinlik! Kui lähete hiljem kuhugi avalikku kambrisse tööle, siis jah, parem mitte kommenteerida. Kui te seda ei tee, siis üldiselt ei huvita see kedagi. Võin teile vaid kinnitada, et keegi ei loe teie isiklikku kirjavahetust ja see kõik loob kogu selle loo üles...

    Igal nädalal tuleb keegi kindlasti minu juurde ja ütleb: "Noh, mu sõbra fotod lekitati mingile anonüümsele avalikule lehele! Abi! Muide, ärge kunagi avaldage midagi anonüümsetel avalikel lehtedel.

  • Teiste jälgimissüsteemide kohta ma ei tea - sellega me kindlasti arvestame, et kaubamärgi mainimine oli negatiivne, jumal andku andeks... Aga võin öelda, et igasugused riigilähedased kamraadid on huvitatud ainult inimestest kelle publikut on üle 5 tuhande ja nende avalik arvamus võib kedagi mõjutada.siis mõjutada. Minu kogemuse kohaselt pole kunagi juhtunud, et meilt profiilihinnanguid telliv personaliagentuur oleks öelnud: "Kellele Navalnõi meeldib, ärge võtke kedagi tööle!"

Tulemuste avaldamisest. Kui palju inimesi teadustöös töötab?

  • 10 parimast reklaamifirmast avaldab praegu seitse. Raske öelda: kui me sellega poolteist aastat tagasi alustasime... Meil ​​on igas valdkonnas mitu inimest – mitu inimest on pankades, mitu inimest on personaliosakonnas, mitu inimest on reklaamis. Ja nüüd mõtleme sellele, kelle juurde on kasulikum esimesena minna, kellele on vaja hakata mingeid liideseid tegema...
  • (inimeste arvu kohta turusegmendis) Mitte rohkem kui 25 inimest, sest me ei vägistanud kedagi.
  • Üldiselt kasutatakse neid turul olevaid tehnoloogiaid minu arvates enam kui 50%. Osad reklaamikampaaniates, osad mingisuguses siseanalüütikas. Ma ütleksin, et 40 protsenti kasutab seda siseanalüütikas, 50–60% müüb seda lõppbrändidele. Aga see oleneb juba reklaamifirmadest endist. Näete, mõned inimesed annavad aru lihtsalt kulutatud raha, pandud reklaami pärast, teised aga kirjutavad, kui palju inimesi nad kohale tõid, millist publikut... Ma ütleks nii, aga ma võin eksida – ma ei tea. ei kujuta ette, kuidas kõik need seltsimehed töötavad. Tean ainult kvantitatiivsete andmete põhjal.

Mõned reklaamid 🙂

Täname, et jäite meiega. Kas teile meeldivad meie artiklid? Kas soovite näha huvitavamat sisu? Toeta meid, esitades tellimuse või soovitades sõpradele, pilve VPS arendajatele alates 4.99 dollarist, algtaseme serverite ainulaadne analoog, mille me teie jaoks leiutasime: Kogu tõde VPS (KVM) E5-2697 v3 (6 tuuma) 10GB DDR4 480GB SSD 1Gbps kohta alates 19 dollarist või kuidas serverit jagada? (saadaval RAID1 ja RAID10, kuni 24 tuuma ja kuni 40 GB DDR4-ga).

Dell R730xd 2x odavam Amsterdami Equinixi Tier IV andmekeskuses? Ainult siin 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6 GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 telerit alates 199 dollarist Hollandis! Dell R420 – 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB – alates 99 dollarist! Millegi kohta lugema Kuidas ehitada infrastruktuuri ettevõtet. klassis koos Dell R730xd E5-2650 v4 serverite kasutusega 9000 eurot senti?

Allikas: www.habr.com

Lisa kommentaar