Arthur Khachuyan: "Todellinen suurdata mainonnassa"

14. maaliskuuta 2017 Arthur Khachuyan, Social Data Hubin toimitusjohtaja, puhui BBDO-luennossa. Arthur puhui älykkäästä seurannasta, käyttäytymismallien rakentamisesta, valokuva- ja videosisällön tunnistamisesta sekä muista Social Data Hub -työkaluista ja tutkimuksesta, joiden avulla voit kohdistaa yleisöjä sosiaalisten verkostojen ja Big Data -tekniikoiden avulla.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Artur Khachuyan (jäljempänä - AH): - Hei! Hei kaikki! Nimeni on Arthur Khachuyan, johdan yritystä Social Data Hub, ja teemme erilaisia ​​mielenkiintoisia henkisiä analyyseja avoimista tietolähteistä, tietokentistä ja teemme kaikenlaista mielenkiintoista tutkimusta ja niin edelleen.

Ja tänään BBDO Groupin kollegat pyysivät meitä puhumaan moderneista teknologioista, joilla analysoidaan big dataa, isoa ja ei niin suurta dataa mainontaan: miten sitä käytetään, näytä mielenkiintoisia esimerkkejä. Toivon, että kysyt kysymyksiä matkan varrella, koska voin kyllästyä enkä paljasta olemusta ja niin edelleen, joten älä ole ujo.

Itse asiassa pääsuunnat, joissa koskaan käytettiin jonkinlaisia ​​"lähes-big-data" -ratkaisuja, ne ovat kaikki selvät - tämä on yleisökohdistus, analyysi, jonkinlaisen analyyttisen markkinointitutkimuksen tekeminen. Mutta aina on mielenkiintoista, mitä lisätietoa löytyy, mitä lisämerkityksiä analyysin soveltamisen jälkeen löytyy.

Miksi tarvitsemme teknologiaa mainontaan?

Mistä aloitamme? Ilmeisin asia on mainonta sosiaalisessa mediassa. Tänään otin sen pois aamulla: jostain syystä VKontakte luulee, että minun pitäisi nähdä juuri tämä mainos... Onko se hyvä vai huono, on toinen kysymys. Näemme, että kuulun ehdottomasti varusmiesten kategoriaan:

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Aivan ensimmäinen ja mielenkiintoisin asia, joka voidaan ottaa teknologisena ratkaisuna... Ensimmäinen asia, jonka halusin päättää ennen aloittamista, on määritellä termit: mitä on avoin data ja mikä on big data? Koska kaikilla ihmisillä on oma käsityksensä tästä asiasta, enkä halua pakottaa ehtojani kenellekään, mutta... Ihan vain, jotta ei tule ristiriitoja.

Henkilökohtaisesti uskon, että avoin data on kaikki, mitä voin tavoittaa ilman sisäänkirjautumista tai salasanaa. Tämä on avoin profiili sosiaalisissa verkostoissa, tämä on hakutuloksia, nämä ovat avoimia rekistereitä jne. Big data, omassa ymmärryksessäni, näen sen näin: jos se on arvokilpi, se on miljardi riviä, jos se on jonkinlainen tiedostojen tallennustilaa, se on jossain petatavu dataa. Muu terminologiassani ei ole big dataa, vaan jotain sellaista.

Erittäin tarkka profilointi ja profiilin pisteytys

Mennään järjestyksessä. Ensimmäinen ja mielenkiintoisin asia, jonka voit keksiä analysoimalla avoimia tietolähteitä, on erittäin tarkka profilointi ja profiilin pisteytys. Mikä tämä on? Tämä on tarina, jossa sosiaalisen verkoston tilisi voi ennustaa paitsi kuka olet, ei vain kiinnostuksen kohteitasi.

Mutta nyt eri lähteitä yhdistämällä saat selville, mikä on keskimääräinen palkkasi, kuinka paljon asuntosi maksaa ja missä se sijaitsee. Ja kaikkea tätä tietoa voidaan käyttää kirjaimellisesti käytettävissä olevin keinoin. Jos esimerkiksi otat tilisi sosiaaliseen verkostoon, katso esimerkiksi missä asut, missä työskentelet; ymmärtää, millä osa-alueella työskentelet yrityksessäsi; lataa vastaavia avoimia työpaikkoja HH:sta ja "Superjobista", jos olet analyytikko, johtaja jne.; katso missä asut (tukikohta, sano CIAN), ymmärrä kuinka paljon maksaa asunnon vuokraaminen tästä paikasta, kuinka paljon maksaa asunnon ostaminen tästä paikasta, ennusta suunnilleen kuinka paljon ansaitset. Lisäksi sosiaalisten verkostojesi avulla voit ymmärtää kuinka paljon matkustat, missä olet ja kuinka uskollinen olet työnantajallesi.

Näin ollen niin suuresta määrästä mittareita voimme tehdä mitä haluamme. Voimme esitellä sinulle sinua kiinnostavan tuotteen. Voitko kuvitella verkkokaupan? Menet sinne - tämä verkkokauppa nappaa tilisi sosiaaliseen verkostoon ja kertoo sinulle: "Masha, erosit juuri poikaystävästäsi, tässä on joitain tiettyjä tuotteita sinulle." Tämä ei ole lähitulevaisuus...

Miten ihmisen maantieteellinen sijainti määritetään?

Vastaukset yleisön kysymyksiin:

  • Tyypillisesti 80 % kaikista lähtöselvityksistä katsotaan tarkaksi asuinpaikaksi. Mutta ihmisille, jotka eivät kirjaudu sisään minnekään, on useita vaihtoehtoja: joko sisäänkirjautuminen tai maantieteellinen sijainti, tai tämä on julkaisujen ja julkaisujen analyysi koko ajalta, jolloin henkilö kirjoitti jotain... Ja jossain, jotain ponnahtaa esiin, kuten "Haluan ostaa lastenrattaat lähellä Akademicheskaya" tai "Näin äskettäin rumia graffiteja täällä seinällä." Eli lähes 80 %:lla ihmisistä heidän maantieteellinen sijaintinsa, työpaikkansa ja asuinpaikkansa voidaan määrittää sosiaalisista verkostoista kerättävien tietojen tai metatietojen avulla.

    Tämä on jälleen julkaisujen analyysi. Yksinkertaisimmassa mielessä tämä on sosiaalisten verkostojen sisäänkirjautumisten ja maantieteellisten sijaintien analyysi, jotka eivät poista jpeg-metatietoja (voit selvittää siitä jotain). Mutta jäljelle jääville ihmisille nämä ovat yleensä tekstilähetyksiä: joko henkilö "loistaa" sijaintiaan kirjoittaessaan jostain tai "loistaa" puhelintaan, jonka avulla voit löytää osan hänen mainoksistaan ​​​​Avitosta tai hänen tilistään " Auto RU". Näiden tietojen perusteella voit yhdistää (esimerkiksi "Myyn auton lähellä Majakovskajaa") ja olettaa tämän karkeasti.

  • Yleensä ihmiset julkaisevat tämän sosiaalisessa mediassa. Työskentelemme vain avoimien lähteiden kanssa ja tässä puhumme yksinomaan avoimista lähteistä. Yleensä he julkaisevat mainoksia, eli XNUMX prosentissa tapauksista yleisin tarina, kun ihmiset "näyttävät" nykyisen matkapuhelinnumeronsa, on ilmoitukset jonkin asian myynnistä. Joko joissain ryhmissä ihminen kirjoittaa ("Myyn sitä tai tuota siellä") tai menee jonnekin.

    Joo! He yleensä kommentoivat näin: ”Vastaa minulle tai lähetä minulle tekstiviesti, soita numerooni. Näin käy hyvin usein ihmisille, jotka myyvät jotain, ostavat jotain sosiaalisista verkostoista, kommunikoivat jonkun kanssa... Näin ollen tämän numeron avulla voit sitten linkittää hänen profiilinsa CIANissa siihen, jos hän on joskus julkaissut jotain tai jälleen kerran Avito. Nämä ovat yksinkertaisesti suosituimpia, parhaita lähteitä, se tulee olemaan edelleen - nämä ovat Avito, CIAN ja niin edelleen.

  • Tämä viittaa verkkokauppaan. Seuraavaksi vuorossa on kasvojentunnistuksen ja profiilien täsmäämisen tekniikka (puhumme siitä). Puhtaasti teoreettisesti tätä voidaan soveltaa offline-kauppaan. Ja ylipäätään iso unelmani on, että kun katubannerit ilmestyvät, kun kävelet kameran ohi, se "jäättää" kasvosi. Mutta tämä tapaus kielletään lailla, koska se loukkaa yksityisyyttä. Toivottavasti se tapahtuu ennemmin tai myöhemmin.
  • Omakohtaisesta kokemuksesta. Hyvin usein, kun joku kirjoittaa sinulle jotain, käytät hänen elämänsä tosiasioita, joita sinun ei näytä tietävän... Useimmissa tapauksissa ihmiset pelkäävät. Mutta! Viimeaikaisten tilastojen mukaan suljettujen tilien määrä sosiaalisissa verkostoissa on laskenut 14 %. Väärennösten määrä kasvaa, avoimien tilien määrä kasvaa - ihmiset ovat siirtymässä yhä enemmän kohti avoimuutta. Uskon, että 3-4 vuoden kuluttua he lakkaavat reagoimasta niin voimakkaasti siihen, että joku tietää heistä sellaista tietoa, jota heidän ei ehkä pitäisi tietää. Mutta se on todella helppo saada katsomalla hänen seinäänsä.

Mitä voidaan ottaa avoimista lähteistä?

On olemassa likimääräinen luettelo asioista, jotka voidaan ymmärtää melko suurella luotettavuudella avoimista lähteistä. Itse asiassa on olemassa vielä enemmän erilaisia ​​mittareita; se riippuu tällaisen tutkimuksen asiakkaasta. Joku HR-toimisto on kiinnostunut siitä, kiroatko sosiaalisessa mediassa vai jossain julkisessa tilassa. Joku on kiinnostunut siitä, pidätkö Navalnyin julkaisuista tai päinvastoin Yhtenäisen Venäjän julkaisuista tai jonkinlaisesta pornografisesta sisällöstä - tällaisia ​​​​asioita tapahtuu melko usein.

Tärkeimmät niistä ovat perhearvot, asunnon, kodin likimääräiset kustannukset, auton etsiminen ja niin edelleen. Tämän perusteella ihmiset voidaan jakaa sosiaalisiin ryhmiin. Nämä ovat Moskovan Tinderin käyttäjiä, keitä he ovat (heidän Facebook-tileiltä löytyneiden kuviensa mukaan); kiinnostuksen kohteidensa perusteella heidät jaetaan useisiin sosiaalisiin ryhmiin:

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Jos siirrymme lähemmäs mainontaa, olemme hitaasti siirtyneet pois tavallisesta mainonnan kohdistuksesta, kun valitset VKontaktessa, että olet kiinnostunut 18-vuotiaista miehistä, jotka ovat liittyneet tiettyihin ryhmiin. Minulla on seuraava kuva, näytän sinulle nyt:

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Pääasia on, että suurin osa nykyisistä palveluista, jotka analysoivat periaatteessa sosiaalisia verkostoja analysoivia ihmisiä, ovat kiinnostuksen kohteiden analysointia tekevä... Ensimmäinen asia, joka ihmisille tulee mieleen, on analysoida tilaajiensa huippuryhmiä. Ehkä tämä toimii joillekin, mutta henkilökohtaisesti mielestäni se on pohjimmiltaan väärin. Miksi?

Tykkäyksiäsi kerätään ja analysoidaan

Ota nyt puhelimesi, katso huippuryhmiäsi - varmasti yli 50 % ryhmistä olet jo unohtanut, tämä on jonkinlaista sisältöä, jolla ei ole sinulle merkitystä. Et kuluta sitä ollenkaan, mutta silti järjestelmä seuraa sinua niiden mukaan: oletko tilannut reseptejä, joitain suosittuja ryhmiä. Eli rikot profiiliasi analysoivaa järjestelmää, eivätkä edut ole perusteltuja.

Jatketaan... Mitä siellä on? Oletamme, mitä muut ihmiset tekevät. Mielestämme sopivin tapa arvioida käyttäjien etuja ovat tykkäykset. Esimerkiksi VKontaktessa ei ole tykkäyssyötettä, ja ihmiset ajattelevat, että kukaan ei tiedä, mistä he pitävät. Kyllä, osa tykkäyksistä esitellään Instagramissa, näemme jotain Facebookissa, mutta suurin osa tiettyjen ryhmien sisällöstä ei välitä tätä yhteisessä syötteessä, ja ihmiset elävät ja ajattelevat, että kukaan ei tiedä mistä he pitävät.

Ja keräämällä tietynlaista sisältöä, joka kiinnostaa meitä, keräämällä näitä viestejä, keräämällä näitä tykkäyksiä ja sitten tarkistamalla tämän henkilön tämän tietokannan avulla, voimme määrittää suurella tarkkuudella, kuka hän on, mikä hänen kohtalonsa on, mistä hän on kiinnostunut. Sijoita hänet täsmälleen tiettyyn sosiaaliseen ryhmään ja ole vuorovaikutuksessa hänen kanssaan.

Auton ostaminen muuttaa käyttäytymistä

Minulla on tällainen esimerkki. Teen heti varauksen, että esimerkkini ovat lähes mainontaa ja markkinointia, koska useimmat tapaukset ovat NDA:n suojaamia ja niin edelleen. Mutta vielä tulee olemaan paljon mielenkiintoista. Joten tarina näiden ihmisten kanssa: nämä ovat miehiä, jotka ostivat auton vuosina 2010-2015. Se, miten heidän online-sosiaalinen käyttäytymisensä on muuttunut, näkyy värillä. Tyttöjen prosenttiosuus tilaajista on muuttunut, tilasin "poikamaisia" julkisia sivuja, löysin pysyvän seksikumppanin...

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Tämä koko asia on jaoteltu automerkin ja henkilömäärän mukaan. Tästä voit tehdä monia mielenkiintoisia johtopäätöksiä ihmisten käyttäytymisestä ja siitä, miten se kaikki toimii. Voin sanoa, että Porsche Cayenne ja istutettu Priora ovat lähes identtisiä yleisömäärän suhteen. Tämän yleisön laatu ja käyttäytyminen ovat erilaisia, mutta määrä on suunnilleen sama. Tästä voit tehdä johtopäätöksesi, mitä haluat, lähempänä markkinoitasi. Jos myyt Audin, käytät iskulausetta "Osta Audi ja eroon vanhemmistasi!" ja niin edelleen.

Kyllä, tämä on hauska esimerkki siitä, että ihmisten käyttäytyminen perustuu tykkäysanalyysiin, mihin ryhmään he siirtyvät, mitä sisältöä analysoivat - lähes 100% todennäköisyydellä tekee selväksi, kuka olet. Koska jos sinulla ei ole pääsyä verkkoliikenteeseen etkä lue henkilökohtaisia ​​viestejä, tykkäykset kertovat aina, kuka tämä henkilö on - raskaana oleva nainen, äiti, sotilas, poliisi. Ja sinulle, joka osaa mainostaa, tämä on suuri osuma.

Vastaukset yleisön kysymyksiin:

  • Jokainen sarake on tässä autossa olevien ihmisten lukumäärä; kuinka heidän käyttäytymismallinsa ovat muuttuneet. Katso: Porsche Cayennen ostaneet ihmiset - noin 550 henkilöä (keltainen), tyttöjen osuus tilaajista on kasvanut.
  • Otos on sosiaalisten verkostojen "Vkontakte", "Facebook", "Instagram" käyttäjät vuosina 2010-2015. Ainoa selvennys: tähän on valittu autot, jotka voidaan tunnistaa valokuvista yli 80 % tarkkuudella tietyillä työkaluilla.
  • Tietyn ajan kuluessa hänen autonsa (no, eli ei hänen, jätämme sen sosiaalisten verkostojen tehtäväksi)... Tietyn ajanjakson aikana henkilöä kuvattiin jatkuvasti auton kanssa, oli sen kanssa, julkaisut olivat erilaisia, valokuvat olivat eri näkökulmista ja niin edelleen. Sitten tulee kuva siitä, ketkä ihmiset kuvaavat millä autoilla ja... Kyllä, tämä on toinen kysymys - luottamus sosiaalisten verkostojen tietoihin.
  • Valitettavasti sosiaalisen median tiedot eivät aina ole oikein sen jälkeen, kun otimme asian esille. Ihmiset eivät aina ole taipuvaisia ​​julkaisemaan tietojaan. Henkilökohtaisesti tein tällaisen tutkimuksen: vertasin Moskovan yliopistojen valmistuneiden määrää sosiaalisiin verkostoihin rekisteröityneiden ihmisten määrään. Keskimäärin 60% enemmän ihmisiä on rekisteröitynyt sosiaalisiin verkostoihin - Moskovan valtionyliopiston valmistuneita tiettynä vuonna tietyillä erikoisaloilla - kuin periaatteessa on. Joten kyllä ​​- täällä on luonnollisesti prosenttiosuus virheistä, eikä kukaan piilota sitä. Tässä otetaan lähtökohtana yksinkertaisesti ne autot, jotka voidaan tunnistaa yli 80 %:n todennäköisyydellä.

Luettelo mallikoulutuksen lähteistä

Tässä on esimerkkiluettelo käytettävissä olevista lähteistä, joiden avulla määritetään suurella varmuudella henkilön sosiaalinen profiili, kuka hän on.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Otamme profiilin sosiaalisista verkostoista, CIANista - asunnon hinta on noin "Head-Hunter", "Superjob" - tämä on tietyn henkilön keskipalkka. Toivottavasti täällä ei ole Head Hunterin edustajia, koska heidän mielestään ei ole kovin hyvä ottaa näitä tietoja heiltä. Tämä on kuitenkin keskipalkka tietyillä alueilla tietyntyyppisistä avoimien työpaikkojen toiminnoista.

"Avito", "Avto.ru": hyvin usein ihmisillä, kun heidän puhelimensa palaa valo, heillä on se varmasti (monissa tapauksissa) ainakin jotain "Avitossa" tai "Avto.russa" tai toisella useilla sivustoilla, joista voit ymmärtää, keitä he ovat. Jos tällä puhelinnumerolla myytiin rattaita tai autoa... Rosstat ja Unified State Juridisten henkilörekisteri ovat edelleen enemmän rekistereitä, joiden avulla voit luokitella työnantajayrityksen - jonkin kaavan mukaan, mallin mukaan, joka kuka tahansa voi asettaa (voit määrittää karkeasti tämän henkilön rahat jne.).

Tinder auttaa keräämään tietoa ihmisten tilanteesta

Lisäksi on olemassa niin mielenkiintoinen asia (vaihtoehtoisesti se on erittäin hauska tutkimuksessa) - tämä on jälleen tietojen kerääminen Moskovan Tinderistä boteilla tälle Tinderille. Etäisyys ihmisiin määritettiin ja sitten heidän likimääräinen sijaintinsa.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Tämän tutkimuksen tavoitteena oli määrittää Tinder-tilien lukumäärä valtion instituutioiden alueella - duumassa, syyttäjänvirastossa ja niin edelleen. Mutta sinä mainostajana voit kuvitella mitä haluat: se voi olla esimerkiksi Starbucks tai joku muu... Eli kuinka monta ihmistä Tinderissä juo kahvia sinulta, tilaa jotain, on kaupoissa Mitä tulee tähän maantieteelliseen sijaintiin: tämä voidaan tehdä millä tahansa palvelulla.

Vastaus yleisön kysymykseen:

  • Tinder? Sinä et tiedä? Tinder on treffisovellus, jossa katsot valokuvia läpi (vasen-oikea), ja tämä sovellus näyttää etäisyyden henkilöön. Jos saat etäisyyden tähän henkilöön kolmesta eri pisteestä, voit määrittää sijainnin noin (+ 5-7 metriä). Tässä tapauksessa määrittäminen syyttäjänviraston tai valtionduuman alueella ei ole niin vaikeaa. Mutta jälleen kerran, se voi olla sinun kauppasi, se voi olla mikä tahansa.

Esimerkiksi kauan, kauan sitten meillä oli sellainen tapaus (ei tutkimus), kun saimme yhdeltä matkapuhelinoperaattorilta tietoja liikennetiheydestä, dataa solukkopisteiden liiketiheydestä ja kaikki tämä tieto oli päällekkäin. valtateillä sijaitsevien mainostaulujen koordinaateissa. Ja matkapuhelinoperaattorin tehtävänä on määrittää suunnilleen kuinka monta ihmistä ohittaa ja voisi mahdollisesti nähdä tämän mainostaulumainoksen.

Jos täällä on mainostaulumainonnan asiantuntijoita, voit sanoa: superluotettavuudella on mahdotonta ymmärtää - joku on tulossa, joku ei katsonut, joku katsoi... Tämä on kuitenkin esimerkki siitä, kuinka monikulmioita on 20 miljardia. nämä Moskovassa, jossa on näiden ihmisten tiheys joka tunti tietyillä reiteillä... Näet missä tahansa hetkessä mitä nämä ihmiset kulkivat ja arvioit karkeasti matkustajavirran.

Vastaus yleisön kysymykseen:

  • Kukaan ei anna sellaisia ​​tietoja. Teimme tällaisen tutkimuksen yhdelle operaattorille, tämä on yksinomaan sisäinen tarina, joten sitä ei valitettavasti esitetä kuvien muodossa. Mutta usein suurilla mainostoimistoilla ei ole ongelmia yhteydenotossa operaattoriin. Ainakin Moskovassa on monia ennakkotapauksia, kun esimerkiksi vakuutusyhtiöt kääntyvät GetTaxin kaltaisten yhtiöiden puoleen, jotka antavat persoonattomia tietoja kuljettajan iästä, ajotavoista (hyvä - huono, holtiton - ei) ennustaakseen. politiikkaa ja niin edelleen. Kaikki kamppailevat tämän kanssa, mutta jollain sisäisellä tasolla anonyymien tietojen antaminen - mielestäni kenelläkään ei ole tällaista ongelmaa.

Kuvan ja kuvion tunnistus

Mene eteenpäin. Suosikkini on kuvantunnistus. Siellä on pieni pala ihmisten etsimisestä kasvojen perusteella, mutta emme useimmiten ota tätä osaa. Otamme erityisesti kuvantunnistuksen ja sen määrittämisen, mitä tässä kuvassa on - auton merkin, sen värin ja niin edelleen.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Minulla on hauska esimerkki:

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Oli tällainen tutkimus tatuointien etsimisestä eri sosiaalisista verkostoista. Näin ollen samaa voidaan soveltaa mihin tahansa brändiin, mihin tahansa visuaaliseen imagoon, melkein mihin tahansa visuaaliseen imagoon. On niitä, joita ei voida määrittää luotettavasti (emme ota niitä).

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Tässä on suosikkini. Automerkit kääntyvät melko usein tähän tehtävään, koska heidän tehtävänsä on esimerkiksi löytää jonkin BMW X6:n kaikki omistajat, ymmärtää keitä he ovat, miten he ovat yhteydessä toisiinsa, mistä he ovat kiinnostuneita ja niin edelleen. Tämä liittyy kysymykseen siitä, millä autoilla ihmiset ottavat kuvia sosiaalisessa mediassa.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Täällä ei ollut suodatusta ollenkaan: esine oli heidän, auto ei ollut heidän; Se on vain autojen hajoamista – ikä ja niin edelleen. Mutta visuaalista kuvantunnistusta käytetään melko usein: tämä on raskaana olevien naisten haku ja brändilogojen etsiminen jonkinlaisesta joukkomediasta (kuka julkaisee mitä).

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Suosikkitapaukseni (jota käyttävät useat ravintolat): millaisia ​​sämpylöitä julkaistaan ​​sosiaalisessa mediassa. Se on hauska asia, mutta itse asiassa sen avulla voit ymmärtää monia mielenkiintoisia asioita, ensinnäkin omista asiakkaistasi: kuka tuli luoksesi ja miksi he tekivät sen. Koska ei ole mikään salaisuus, että sushibaareissa useimmat ihmiset (en sano "tytöt") ottavat kuvia kirjautuakseen sisään, ottaakseen kuvan jostain jne.

Brändi voi hyödyntää tätä. Brändi on kiinnostunut siitä, millaisia ​​tuotteita se tarvitsee kauniisti valokuvatakseen ja postatakseen, millaisia ​​ihmisiä sinne on tullut. Tämä asia voidaan tehdä melkein mistä tahansa, ruoasta.

Videokuvion tunnistus

Vastaus yleisön kysymykseen:

  • Ei videolla. Meillä se on testitilassa. Kokeilimme tätä tekniikkaa, mutta kävi ilmi, että... Se tunnistaa kaiken videolla melko hyvin, mutta emme ole löytäneet sille sovellusta mistään. Hei hei. Sen lisäksi, että analysoin kuinka paljon ja mitkä videobloggaajat puhuvat jossain... Sellainen tutkimus oli. Kuinka monet heidän kasvonsa kohtaavat, kuinka usein. Mutta brändit eivät ole vielä keksineet, mistä keksivät tämän. Ehkä se joskus tulee.

Jälleen, tämä on ruokaa, se voi olla raskaana olevia naisia, miehiä (ei raskaana), autoja - mitä tahansa.

Vaihtoehtona oli uudenvuoden opiskelu yhdelle medialle. Myös kaukana mainonnasta, mutta silti. Tällaista ruokaa ihmiset paastosivat uudenvuoden kunniaksi:

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Se on myös jaoteltu täällä iän mukaan. Siinä näkyy sellainen korrelaatio, että nuoret enimmäkseen tilaavat ruokaa, aikuiset enimmäkseen perinteisen pöydän. Se on hauska asia, mutta kuvittelemalla sen brändin omistajana voit arvioida monia asioita: kuka käsittelee tuotettasi ja miten, mitä hän kirjoittaa siitä. Usein ihmiset eivät aina mainitse itse brändiä tekstissä, ja perinteiset analyyttiset seurantajärjestelmät eivät aina ymmärrä ja löydä tätä brändin mainintaa pelkästään siksi, että sitä ei mainita tekstissä. Tai teksti on kirjoitettu väärin, ei ole hash-tageja tai mitään.

Valokuvat näkyvät. Valokuvauksen avulla voit kertoa, onko se kehyksen keskikohde vai ei. Sitten voit nähdä, mitä tämä henkilö kirjoitti. Mutta useimmiten sitä käytetään etsimään potentiaalisia yleisöjä, jotka ovat ajaneet tietyillä autoilla ja niin edelleen. Ja sitten teemme paljon mielenkiintoista näiden autojen kanssa.

Botit opetetaan matkimaan ihmisiä

Siellä oli myös tällainen vaihtoehto ihmisten laskemiseen:

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

On mahdollisuus vertailla ihmisiä, kun haluat löytää ihmisiä joidenkin valokuvien avulla, ymmärtää heidän sosiaalisen profiilinsa, keitä he ovat. Palaamme jälleen kysymykseen, että jos meillä on kamera offline-kaupassa, niin tämä on melko hyvä tapa ymmärtää, kuka tulee luoksesi, keitä nämä ihmiset ovat, mistä he ovat kiinnostuneita, mikä sai heidät tulemaan luoksesi. .

Seuraavaksi tulee mielenkiintoisin asia: jos keräämme heidän tilinsä sosiaalisissa verkostoissa, ymmärrämme, keitä nämä ihmiset ovat, mistä he ovat kiinnostuneita, voimme (vaihtoehtona) tehdä näiden ihmisten kaltaisen botin; tämä robotti alkaa elää kuten nämä ihmiset ja analysoida, mitä mainoksia se näkee eri sosiaalisissa verkostoissa. Näin voit ymmärtää tarkasti, mitkä tuotemerkit on kohdistettu tälle henkilölle. Tämä on myös melko yleinen tarina, kun sinun ei tarvitse vain analysoida, kuka tämä henkilö on ja mitä kiinnostuksen kohteita hänellä on, vaan myös millaiseen mainontaan mahdollisten kilpailijoiden tai muiden kiinnostuneiden tulisi kohdistaa.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Yhteyksien analysointi sosiaalisissa verkostoissa

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Seuraava mielenkiintoinen asia on ihmisten välisten suhteiden analyysi. Itse asiassa verkon yhteyksien analyysi, nämä verkkokaaviot - tässä ei ole vähän, ei mitään uutta, kaikki tietävät tämän.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Mutta sovellus mainontatehtäviin on mielenkiintoisin. Tämä on ihmisten haku, jotka määrittävät trendejä, tämä on ihmisten haku, jotka levittävät tietoa tiettyjen kriteerien mukaisesti tässä verkostossa. Oletetaan, että olemme kiinnostuneita tietyn BMW-mallin samoista omistajista. Tuomalla ne kaikki yhteen voimme löytää ne, jotka hallitsevat yleistä mielipidettä. Nämä eivät välttämättä ole autobloggaajia ja niin edelleen. Yleensä nämä ovat yksinkertaisia ​​tovereita, jotka istuvat useilla julkisilla sivuilla, ovat kiinnostuneita jostain sisällöstä ja voivat hyvin lyhyessä ajassa houkutella brändisi tai sinua kiinnostavan henkilön tälle vastuualueelle, kiinnostusta.

Täällä on tällainen esimerkki. Meillä on potentiaalisia ihmisiä, ihmisten välisiä yhteyksiä. Täällä oranssit ovat ihmisiä, pienet pisteet ovat yhteisiä ryhmiä, yhteisiä ystäviä.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Jos keräät kaikki nämä yhteydet heidän välillään, näet hyvin selvästi, että on ihmisiä, joilla on suuri määrä yhteisiä ryhmiä, yhteisiä ystäviä, he ovat siellä keskenään... Ja jos tämä sama visualisointi jaetaan ryhmiin kiinnostuksen kohteiden mukaan, sisällön mukaan, mitä he levittävät, kuinka paljon he ovat vuorovaikutuksessa keskenään... Tästä näet, että edellisestä kuvasta tuli tällainen:

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Tässä ryhmät erottuvat selvästi värin perusteella. Tässä tapauksessa nämä ovat kauppakorkeakoulun maisteriopiskelijamme. Täältä näet, että violetit/siniset ovat niitä, jotka pitävät Transparency Internationalin, Open Russian ja Hodorkovskin julkisista sivuista. Vasemmalla alhaalla ovat vihreät, jotka rakastavat Yhtenäistä Venäjää.

Näet, että edellinen kuva oli tällainen (nämä ovat vain ihmisten välisiä yhteyksiä), mutta on selvästi rajattu. Eli kaikki ihmiset ovat aina yhteydessä toisiinsa, heillä on samat kiinnostuksen kohteet, he ovat ystäviä keskenään. Jotkut ovat ylhäällä, toiset alhaalla ja jotkut muut toverit siellä. Ja jos jokainen näistä pienistä alakaavioista visualisoidaan erikseen muilla parametreilla ja tarkastellaan sisällön leviämisen nopeutta (karkeasti sanottuna kuka julkaisee mitä siellä), voit löytää jokaisesta osasta yhden tai kaksi henkilöä, jotka pitävät aina yleistä mielipidettä käsissään, vuorovaikutuksessa jonka kanssa, pyytää lähettämään jonkinlaisen postauksen tai jotain muuta - voit saada vastauksen koko mielenkiintoiselta yleisöltä.

Minulla on toinen tällainen esimerkki. Myös kaavio: nämä ovat esimerkkinä sosiaalisista verkostoista löydettyjä BBDO Groupin työntekijöitä. Se näyttää mielenkiintoiselta, isolta, vihreältä, yhteyksiä niiden välillä...

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Mutta minulla on vaihtoehto, jossa ryhmät on jo rakennettu niiden välille. Sitten, jos jotakuta kiinnostaa, on olemassa interaktiivinen versio - voit klikata ja katsoa.

Ylhäällä oikealla ovat ne, jotka rakastavat Putinia. Täällä violetit ovat suunnittelijoita; ne, jotka ovat kiinnostuneita suunnittelusta, jostain mielenkiintoisesta ja niin edelleen. Tässä valkoiset asiat ovat johtoryhmä (ilmeisesti, kuten ymmärrän); Nämä ovat ihmisiä, jotka eivät yleensä ole millään tavalla sidoksissa, mutta työskentelevät suunnilleen samoissa tehtävissä. Loput ovat heidän yhteisiä ryhmiään, yhteyksiään ja niin edelleen.

Brändit eivät tarvitse bloggaajia, vaan mielipidejohtajia

Otamme nämä ihmiset ja löydämme heidät - sitten mainostoimisto, mainostoimisto päättää itse: se voi antaa rahaa tälle henkilölle, jotta hän jollakin tavalla on vuorovaikutuksessa tämän sisällön, jonkin muun kanssa tai ohjaa heille oman mainoskampanjansa. Tätä käytetään myös melko usein, varsinkin nyt, koska kaikki brändit haluavat tehdä yhteistyötä bloggaajien kanssa, he haluavat, että heidän sisältöään mainostetaan, mutta mainostoimistot eivät todellakaan halua ottaa yhteyttä (no, tätä tapahtuu).

Ja todellinen tie ulos tästä tilanteesta on löytää ihmisiä, jotka eivät ole bloggaajia, eivät kauneusbloggaajia, vaan esimerkiksi joitain todellisia olentoja, jotka ovat vuorovaikutuksessa tämän brändin kanssa ja jotka voivat kirjoittaa jollekin kurjalle julkiselle sivulle "Mail.ru Answers", saada tietty määrä näyttökertoja. Nämä ihmiset, jotka ovat jatkuvasti kiinnostuneita tämän henkilön sisällöstä, levittävät koko asiaa ja brändi saa osansa.

Toinen vaihtoehto tällaisen tekniikan käyttämiseen on nyt varsin relevantti - botien etsiminen, suosikkini. Tämä on maineriski kilpailijoillesi ja mahdollisuus karsia epäolennaiset ihmiset pois mainoskampanjasta ja kaikesta muusta (kommenttien poistaminen ja ihmisten välisten yhteyksien etsiminen). Minulla on tällainen esimerkki, se on myös suuri ja interaktiivinen - voit siirtää sitä. Nämä ovat ihmisten yhteyksiä, jotka kirjoittivat kommentteja Lentach-yhteisöön.

Tämä esimerkki on, jotta ymmärrät kuinka hyvin ja helposti näkyvät robotit ovat; ja tätä varten sinulla ei tarvitse olla teknistä tietämystä. Tämä tarkoittaa, että "Lentach" julkaisi julkaisun FBK:n tutkimuksesta Dmitri Medvedevistä, ja tietyt ihmiset alkoivat kirjoittaa kommentteja. Keräsimme kaikki kommentteja kirjoittaneet ihmiset - nämä ihmiset ovat vihreitä. Nyt siirrän sen:

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Ihmiset ovat vihreitä (jotka kirjoittivat kommentit). He ovat täällä, he ovat täällä. Niiden väliset siniset pisteet ovat heidän yhteisiä ryhmiään, keltaiset pisteet ovat heidän yhteisiä tilaajiaan, ystäviään ja niin edelleen. Suurin osa ihmisistä on yhteydessä toisiinsa. Koska riippumatta kolmen, neljän, viiden kättelyn teoriasta, kaikki ihmiset ovat yhteydessä toisiinsa sosiaalisissa verkostoissa. Ei ole olemassa ihmisiä, jotka olisivat erossa toisistaan. Jopa sosiaalisesti fobiset ystäväni, jotka käyttävät VKontaktea yksinomaan videoiden katseluun, ovat edelleen tilattuja samoille julkisille sivuille kuin me.

Navalny käyttää myös botteja. Kaikilla on botit

Suurin osa ihmisistä (tässä se on, täällä) on yhteydessä toisiinsa. Mutta on niin pieni ryhmä tovereita, jotka ovat yksinomaan ystäviä keskenään. Tässä he ovat, pienet vihreät, tässä ovat heidän yhteiset ystävänsä ja ryhmänsä. Täällä ne jopa putosivat erikseen:

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Ja onnekas sattuma, juuri nämä ihmiset kirjoittivat tämän viestin alle: "Navalnyilla ei ole todisteita" ja niin edelleen, kirjoittivat samat kommentit. En tietenkään uskalla vetää johtopäätöksiä. Mutta siitä huolimatta minulla oli toinen postaus Facebookissa, kun Lebedevin ja Navalnyin välillä käytiin keskustelua, analysoin kommentteja samalla tavalla: kävi ilmi, että kaikki ihmiset, jotka kirjoittivat "Lebedev on paskaa", he eivät olleet olleet sosiaalisessa mediassa. verkot äskettäin neljä kuukautta, ei tilannut yhtään julkista sivua, meni yhtäkkiä tähän viestiin, kirjoitti juuri tämän kommentin ja lähti. Tästä on taas mahdotonta vetää johtopäätöksiä, mutta joku Navalnyin tiimistä kirjoitti minulle kommentin, että he eivät käytä botteja. No okei!

Lähempänä mainontaa, lähempänä brändiä. Kaikilla on nyt botit! Niitä on meillä, kilpailijoillamme ja muillakin. Ne täytyy heittää pois tai jättää elääkseen hyvin; Tällaisten tietojen perusteella (osoittaa edelliseen diaan) saa ne täydellisyyteen niin, että ne näyttävät oikeilta ihmisiltä, ​​ja käytä niitä vasta sitten. Vaikka botien käyttö on huonoa! Kuitenkin melko yleinen tarina...

Automaattisessa tilassa tällainen asia antaa sinun suodattaa analyysistäsi pois analyysin kannalta epäolennaisia ​​ihmisiä, joita ei pitäisi ottaa mukaan otokseen, ei pitäisi ottaa mukaan tähän tutkimukseen. Hyvin usein käytetty. Toisaalta kaikki auton omistajat eivät todellakaan omista autoja. Joskus ihmiset ovat kiinnostuneita vain ihmisistä, joilla on mahdollisesti auto, jotka istuvat joissakin ryhmissä, kommunikoivat jonkun kanssa, heillä on siellä tietty yleisö.

Faktojen ja mielipiteiden analyysi

Seuraava minulla on myös suosikkini. Tämä on tosiasioiden ja mielipiteiden analyysiä.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Nykyään jokainen tietää kuinka mainita brändinsä eri lähteissä. Tässä ei ole salaisuutta. Ja kaikki näyttävät osaavan laskea tonaalisuuden... Vaikka henkilökohtaisesti mielestäni sävymittari itsessään ei ole kovin kiinnostava, koska kun tulet sanomaan asiakkaalle: "Mies, sinulla on 37% neutraali", ja hän sanoo niin. , "Vau! Viileä!" Siksi olisi mielenkiintoisempaa siirtyä hieman pidemmälle: tunteiden arvioinnista arvioimaan mielipiteitä siitä, mitä he sanovat tuotteestasi.

Ja tämä on myös erittäin mielenkiintoinen asia, koska... Itse uskon, että neutraaleja viestejä ei periaatteessa voi olla, koska jos joku kirjoittaa jotain julkiseen tilaan, tämä viesti on jollain tapaa värittynyt. Itse en ole koskaan nähnyt neutraalia viestiä, jossa mainittaisiin brändi. Yleensä se on jonkinlaista likaa.

Jos otamme suuren määrän näitä viestejä (saattaa olla miljoonia, 10 miljoonaa), korostamme jokaisesta viestistä pääidean, yhdistämme ne, voimme ymmärtää varsin luotettavasti, mitä ihmiset sanovat tästä brändistä, mitä he ajattelevat. "En pidä pakkauksesta", "En pidä johdonmukaisuudesta" ja niin edelleen.

Mitä ihmiset ajattelevat Transaerosta, Chupa Chupsista ja Yhdysvaltain presidentistä?

Minulla on hauska esimerkki: tämä on infografiikka siitä, mitä sosiaalisen verkoston käyttäjät tekisivät Transaero-yrityksen kanssa sen konkurssin jälkeen.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Siellä on monia mielenkiintoisia esimerkkejä: polta, tapa, karkota Eurooppaan, jopa 2% kirjoitti - "Lähetä heidät Syyriaan sotilasoperaatioihin." Hauskuudesta eteenpäin siirryttäessä, se voi olla melkein mikä tahansa merkki - suosikki koiranruoasta joihinkin autoihin. Joka ei pidä pakkauksesta, kuka ei pidä oikeista asioista – tämän kanssa voi aina työskennellä, tämän voi aina ottaa huomioon. On olemassa suuri joukko esimerkkejä, joissa ihmiset melkein muuttivat tuotteidensa tuotantoa, koska he kirjoittivat sosiaalisessa mediassa, että Chupa Chups ei ollut tarpeeksi pyöreä tai se ei ollut tarpeeksi makea.

On toinenkin hauska esimerkki. Arvatkaa mitä kommentteja ja kenestä?

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Jostain syystä mielipiteiden analysointia, viesteistä poimittujen tosiasioiden analysointia ei nykyään käytetä kovinkaan paljon eikä se ole kovin yleistä. Vaikka tämä tekniikka ei olekaan supersalainen, siinä ei ole käytännössä lainkaan osaamista, koska ihmisten kommenteista subjektin, predikaatin irrottaminen ja ryhmittely ei vaadi laskennallisen lingvistiikan neroa. Ei se niin vaikeaa ole tehdä. Mutta toivon, että parin seuraavan vuoden aikana ihmiset alkavat käyttää tätä, koska... Se on siistiä - tämä on niin automaattista palautetta! Tiedät aina, mitä he sanovat sinusta. Ymmärräthän, että tämä on tehty Yhdysvaltain presidentistä.

Vastaus yleisön kysymykseen:

  • Kyllä, tämä on Facebook englanniksi. Ne on käännetty täällä venäjäksi. Tämä on kirjoitettu jossain.

Big Data ja poliittinen teknologia

Itse asiassa minulla on monia erilaisia ​​mielenkiintoisia esimerkkejä politiikasta Trumpista ja kaikista muista, mutta päätimme olla tuomatta niitä tänne. Mutta on yksi poliittinen esimerkki.

Nämä ovat duuman vaalit. Milloin olit? Viime vuonna? Melkein puolitoista vuotta sitten.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Tässä on ihmisiä, jotka pystyivät määrittämään tarkan sijaintinsa tiettyyn geopisteeseen asti ymmärtääkseen, mihin vaalipiiriin he joutuvat. Ja sitten näistä ihmisistä otettiin vain ne, jotka ilmaisivat varman mielipiteensä, joita he äänestäisivät.

Politiikan näkökulmasta tämä ei ole oikein oikein, koska tämä koko asia on normalisoitava väestötiheydellä ja niin edelleen. Siitä huolimatta täällä siniset äänestävät tiedät ketä, punaiset äänestävät oppositiotovereita, joita ei muuten ollut paljon.

Itse uskon, että Big Data ei lähiaikoina saavuta poliittista teknologiaa, mutta vaihtoehtona ehdokas on myös brändi. Ja tämä on myös jossain määrin analyysiä faktoista ja mielipiteistä brändistäsi, ja melko mielenkiintoinen asia, koska voit ymmärtää reaaliajassa, kuka tekee mitä. Tiedän useita tapauksia BBC:ltä, kun he seurasivat sosiaalisia verkostoja reaaliajassa jossain lähetyksessä: siellä oli sellainen ja sellainen vastaus, ihmiset kirjoittavat siitä, kysyvät sellaista ja sellaista - ja se on hienoa! Luulen, että se otetaan käyttöön hyvin pian, koska se kiinnostaa kaikkia.

Brändiasemien mallintaminen

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Seuraavaksi minulla on brändiasemien mallinnus. Pieni, lyhyt pätkä siitä, kuinka voit luokitella brändejä käyttämällä erilaisia ​​​​mittareita (ei tykkäyksiä tilaajista sosiaalisissa verkostoissa, vaan käyttämällä monimutkaisia ​​​​mittareita, kiinnostusta sisältöön, mittareiden vastaanottamiseen käytettyä aikaa).

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Minulla on esimerkki "pharmasta" tietystä syystä. Tässä pienet ympyrät ovat sisäisiä, kirkkaita - tämä on tekstisisällön määrä, jonka brändi itse luo, suuri ympyrä on valokuva- ja videosisällön määrä, jonka brändi itse luo.

Keskustan läheisyys osoittaa, kuinka kiinnostavaa sisältö on yleisölle. Siellä on iso malli, siellä on kasa kaikenlaisia ​​parametreja: tykkäykset, uudelleenpostaukset, vastausaika, kuka siellä keskimäärin jakoi... Tässä näet: siellä on ihana ”Kagotsel”, joka pumppaa valtavasti rahaa oman sisällön luomiseen, ja tämän vuoksi he ovat melko lähellä keskustaa. Ja on tovereita, jotka myös luovat omaa sisältöä, mutta yleisö ei ole siitä kiinnostunut. Tämä ei ole kovinkaan riittävä esimerkki, koska kaikki nämä tilit ovat käytännössä kuolleet.

Yegor Creediä rakastetaan enemmän kuin Bastaa

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Valitettavasti loput... mistä näyttää... No, on olemassa myös venäläisiä räppäreitä, vaihtoehtona oikeista yrityksistä.

Mikä on plussa? Tosiasia on, että yritys voi laittaa melkein mitä tahansa tällaiseen malliin, alkaen brändillesi työskentelevien tilaajien keskimääräisestä palkasta; mikä tahansa malli, josta he pitävät. Koska jokainen mainostoimisto laskee omat mittarinsa eri tavalla, brändit laskevat omat mittarinsa eri tavalla.

Täällä on myös yksi - Basta, joka tuottaa suuren määrän sisältöä, mutta sijaitsee reunalla, koska tämä sisältö ei ilmeisesti ole kovin kiinnostavaa yleisölle. Jälleen kerran, en uskalla tuomita. Mutta silti on Yegor Creed, joka sosiaalisten verkostojen mukaan on melkein aikamme paras esiintyjä, mutta julkaisee vain henkilökohtaiset valokuvansa. Siitä huolimatta hänellä on suuri määrä tilaajia: heitä on noin miljoona. En muista tarkkaa numeroa; Muistan, että näiden ihmisten sitoutumisprosentti on paljon korkeampi kuin 85%, eli miljoonaa tilaajaa kohden hän saa 850 tuhatta vastausta näiltä oikeilta ihmisiltä - tämä on todellista hulluutta. Tämä on totta.

Arthur Khachuyan: "Todellinen suurdata mainonnassa"

Vastaukset yleisön kysymyksiin:

Kuinka kauan räppärianalyysimallin luominen kesti?

  • Jokaisella on oma kohdeyleisö, näiden ihmisten kiinnostuksen kohteet lasketaan jokaiselle... Kaikki tämä normalisoituu noin etäisyydelle keskustasta, niiden säteittäinen asento ei ole tärkeä (se vain levitetään täällä kauneuden vuoksi, jotta he tekevät eivät törmää toisiinsa). Vain likimääräinen läheisyys keskustaan ​​on tärkeää. Tämä on malli, jota käytämme. Esimerkiksi minä pidän ympyrästä enemmän, jotkut ihmiset ajattelevat sitä puoliympyränä.
  • Tämä malli koottiin nopeasti, kahdessa tai kolmessa tunnissa (kyllä, yksi henkilö). Tähän lisättiin vain mittareita: mitä kerromme millä, laskemme yhteen ja sitten normalisoimme sen jotenkin. Riippuu mallista. Jotkut ihmiset ovat kiinnostuneita tilaajiensa keskipalkoista (tämä ei ole vitsi). Ja tätä varten sinun on löydettävä heidän yhteystietonsa, Avito, laskettava kaikki, kerrottava se. Sattuu, että tämän huomioon ottaminen vie kauan, mutta erityisesti tämä (osoittaa edelliseen diaan) - parametrit ovat täällä hyvin yksinkertaisia: tilaajat, uudelleenjulkaisut ja niin edelleen. Valmistukseen meni noin kahdesta kolmeen tuntia. Vastaavasti tämä asia päivitetään reaaliajassa, ja voit käyttää sitä.

Nyt tulee se hauskin osuus. Olen lopettanut esimerkit, koska ei ole mielenkiintoista puhua pitkään yksin. Ja toivon, että nyt esität kysymyksiä, ja itse asiassa siirrymme aiheesta toiseen, koska minulla on sellaisia ​​esimerkkejä siitä, kuinka teknologioita voidaan käyttää ja niin edelleen...

Vastaukset yleisön kysymyksiin:

  • Minulla oli yksi ja ainoa henkilökohtainen tapaus yhden niin sanoakseni "kasinon läheisyydessä", kun sinne laitettiin kamera, kasvot tunnistettiin ja niin edelleen. Tunnistettujen henkilöiden prosenttiosuus on varmasti melko suuri - sekä meidän että kilpailijoiden. Mutta se on itse asiassa aika mielenkiintoista. Pidän tätä mielenkiintoisena asiana: voit ymmärtää keitä nämä ihmiset ovat ja ennustaa melko hyvin, miksi he tarkalleen ottaen tulivat tänne, mikä on muuttunut heidän elämässään niin paljon, että he päättivät tulla kasinolle. Mutta mitä tulee tiettyihin bisnestyyppeihin... Jos laitat sellaisen apteekkiin, siinä ei ole mitään järkeä - et voi ennustaa, miksi henkilö tuli apteekkiin.

    Maailmanlaajuinen tehtävä tässä oli rakentaa malli, jotta ymmärrettäisiin, milloin henkilö mahdollisesti haluaa olla kiinnostunut brändistäsi, jotta voit antaa hänelle mainontaa ei sen jälkeen, kun hän on ostanut jotain (kuten nyt tapahtuu), vaan antaa hänelle mainontaa " ennusteessa” siitä, milloin tämä kaikki tapahtuu. Se oli mielenkiintoista tällaisen "lähes-kasinon" kanssa; osoittautui, että näitä ihmisiä on melko mielenkiintoinen prosenttiosuus - miksi: joku sai yhtäkkiä ylennyksen, joku muu sai jotain muuta - niin mielenkiintoisia oivalluksia. Mutta joidenkin kauppojen, vähittäiskaupan, jonkinlaisten pillereiden myymälän kanssa minusta näyttää siltä, ​​​​että se ei ole oikein.

Käytetäänkö Big Dataa offline-tilassa?

  • Se oli offline-tilassa. Sinun on vain ymmärrettävä tarkasti, karkeasti, sopiiko tämä malli vai ei. Jälleen, kuohuvedellä... Olen itse asiassa kiinnostunut kaikesta, mutta en henkilökohtaisesti ymmärrä kuinka paljon näiden ihmisten profiilit, heidän käyttäytymisensä voivat riippua siitä, milloin he haluavat ostaa pullotettua vettä. Vaikka tämä saattaa olla totta, en tiedä.

Kuinka monta avointa sosiaalisen median tiliä on?

  • Meillä on nimenomaan 11 sosiaalista verkostoa - nämä ovat "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagram" ja joitain pieniä asioita (voin katsoa luetteloa, kuten "Mail.ru" ja niin edelleen) . VKontaktessa meillä on ehdottomasti kopio kaikista näistä tovereista. Meillä on ihmisiä VKontaktessa - se on 430 miljoonaa kaikista koskaan olleista (joista noin 200 miljoonaa on jatkuvasti aktiivisia); on ryhmiä, näiden ihmisten välillä on yhteyksiä ja on sisältöä, joka kiinnostaa meitä (teksti), ja osa mediaa, mutta hyvin pientä... Karkeasti sanottuna katsomme tätä kuvaa: jos siellä on kasvoja, me tallenna ne, jos on meemi, tallennamme ne Emme tallenna sitä, koska meilläkään ei riittäisi mediasisällön tallentamiseen.

    Siellä on venäjänkielinen Facebook. Jossain nyt 60-80% on Odnoklassnikeja, parin kuukauden päästä saamme ne kaikki loppuun asti. Venäjän Instagram. Kaikille näille sosiaalisille verkostoille on olemassa ryhmiä, ihmisiä, heidän välisiä yhteyksiä ja tekstiä.

  • Noin 400 miljoonaa ihmistä. Siinä on hienovaraisuus: on ihmisiä, joiden kaupunkia ei ole määritelty (he ovat mahdollisesti venäläisiä / ei-venäläisiä); Näistä sosiaalisten verkostojen keskiarvo on 14% suljetuista tileistä VKontaktessa, en tiedä tarkkaa lukua Facebookissa.
  • Emme myöskään tallenna mediaa Instagramiin – vain jos siellä on kasvoja. Emme tallenna tällaista (muuta) mediasisältöä. Yleensä kiinnostavaa: vain tekstiä, ihmisten välisiä yhteyksiä; Kaikki. Yleisin tutkimus Instagramissa on tavallinen yleisötutkimus: keitä nämä ihmiset ovat, ja mikä tärkeintä, näiden ihmisten yhteys muihin sosiaalisiin verkostoihin. Etsi tämän henkilön profiili Vkontaktesta ja Facebookista, jotta voit laskea hänen ikänsä ja niin edelleen.
  • Kaikkia muita ei vielä tarvitse ottaa - yksinkertaisesti siksi, ettei asiakkaita ole. Mitä tulee kieleen: meillä on venäjä, englanti, espanja, mutta silti sitä käytetään yksinomaan venäläisille brändeille; tai yritykset, jotka tuovat niitä Venäjältä.
  • Haastattelemme ihmisiä päivittäin monissa, monissa, monissa säikeissä: keräämme tietoja keräämällä verkkoa ja päivitämme näitä indikaattoreita Apin avulla. 2-3 päivässä voit käydä läpi koko "VKontakten" läpi ne; Noin viikossa voit käydä läpi koko Facebookin ja ymmärtää kuka on päivittänyt mitä ja mikä ei. Ja sitten kokoakaa nämä ihmiset erikseen: mikä on muuttunut, kirjoita koko tarina ylös. Kokemukseni mukaan hyvin harvoin jonkun vanhaa sosiaalisen median profiilia on käytetty mihinkään todelliseen liiketoimintaan. Tuolloin yksi poliittinen hahmo hakeutui, ja hänen tehtävänsä oli ymmärtää, millaisia ​​ihmisiä päämajaan tulee, keitä nämä ihmiset olivat 6-8 kuukautta sitten (poistiko he profiilinsa, mutta itse asiassa toiselle ehdokkaalle saapui äänestysliput pilata).

    Ja pari kertaa - henkilökohtaisia ​​tarinoita, kun jonkun valokuvat julkaistiin julkisesti. Oli pakko löytää yhteyksiä jne. Valitettavasti harmittaa, mutta emme voi todistaa oikeudessa, koska tietokantamme on juridisesti epälikvidi.

  • MongoDB-tallennustila on suosikkini.

Sosiaaliset verkostot yrittävät taistella tiedonkeruuta vastaan

  • Yleensä lataamme vain luettelon näistä tileistä mainostajille, ja sitten he käyttävät tavallista... Eli sosiaalisissa verkostoissa, VKontaktessa, voit määrittää luettelon näistä ihmisistä.

    Mutta Facebook käyttää ostettuja evästeitä. Emme itse työskentele evästeiden kanssa, mutta oli useita tarinoita, kun mainostaja itse antoi joillekin ihmisille, olimme vuorovaikutuksessa heidän kanssaan - heillä on nämä verkostot, teaser-, ei-teaser-mainoksilla, nämä "evästeet". Voit sitoa sen - ei epäilystäkään! Mutta en todellakaan pidä tästä jutusta, koska en usko, että se on kovin aito. Tämä on puhtaasti minun mielestäni, se on kuin TNS, joka "seuraa" televisioita - ei ole selvää, katsotko tätä televisiota vai et, pesetkö astioita television ollessa päällä... Ja se on sama täällä : Googlen usein Internetissä jotain, mutta se ei tarkoita, että haluaisin ostaa sen.

  • Jos käytät jonkinlaista tavallista kontekstuaalista mainontaverkostoa: Minulla oli useita tarinoita, kun purimme nämä ihmiset heille ja yritimme liittää heidät heidän käyttöliittymiensä avulla "evästeisiin" heidän sivustoillaan. Mutta en todellakaan pidä sellaisista asioista.

Kaava Internet-käyttäjän palkan laskemiseen

  • Keskipalkan yleinen kaava: tämä on alue, jossa henkilö asuu, tämä on yritysluokka, jossa hän työskentelee (eli yritys, joka on hänen työnantajansa), sitten otetaan hänen asemansa tässä yrityksessä, keskiarvo tämän viran palkka on arvioitu... Keskipalkka otettu "Head Hunterista" ja "Superjobista" (ja on useita muita lähteitä) tietylle avoimelle työpaikalle tietyllä alueella ja tietyssä liiketoimintaympäristössä.

    "Avitosta" ja "Avto.rusta" otetaan yleensä lisäparametreja, jos henkilö on valaissut puhelimen. Avitolla näet, millaisia ​​asioita henkilö myy - kalliita, edullisia, käytettyjä, käyttämättömiä. "Avto.ru" -sovelluksella voit nähdä, onko hänellä auto - hän omistaa sen, hän ei omista sitä. Tämä on jossain alle 20 % ihmisistä, jotka vahingossa pudottivat puhelimensa jonnekin, ja heidän tilinsä voidaan linkittää näihin tietoihin.

Millaisia ​​volyymeja tiedonkeruuyritys toimii?

  • Tallennettujen valokuvien määrä petatavuina on 6,4. Tarkkaa kasvuvauhtia en nyt osaa sanoa, koska vuonna 2016 aloimme nauhoittaa "periskooppeja" ja juuri aloitimme videoiden tallentamisen.

    En osaa sanoa tarkalleen milloin se oli nolla. Muutimme yrityksestä toiseen - nämä ovat kaikki pitkiä tarinoita. Mutta voin sanoa, että VK, Facebook, Instagram ja Twitter - kaikki tämä bisnes (ihmiset, ryhmät ja heidän väliset yhteydet) tekstin ja sisällön kanssa - tämä ei itse asiassa ole paljon dataa, on epätodennäköistä, että petatavukin riittäisi. Luulen, että se on 700 gigatavua, luultavasti 800.

Autatko asiakkaita määrittämään nykyisen markkinaraon ja minne kaivaa?

  • Kun asiakas tulee, ehdotamme hänelle tällaisia ​​asioita, mutta me itse, kuten Google Trends, emme tee sellaisia.
  • Meillä oli useita lähes sosiologisia tarinoita, joissa oli vaalihistoriaa, vaaleja edeltävä historia - analysoimme kaiken. Brändeissä ja mielipiteiden arvioinnissa kaikki on melkein aina samaa mieltä. Tässä on vaali-vaalitarinoita - ei (arvioinnin kanssa siitä, kumman ehdokkaan pitäisi voittaa). En tiedä kuka tässä on väärässä – me vai ne, jotka ajattelevat VTsIOMissa.
  • Yleensä otamme nämä kontrollitulokset itse brändiltä, ​​he ottavat ne tovereilta, jotka tilaavat tutkimusta - puhelintutkimusta, markkinointitutkimusta ja niin edelleen. Lisäksi koko asian voi tarkistaa perusasioista: joku vastasi postituslistalle, joku teki kyselyitä... Jos kyseessä on iso brändi (esim. Coca-Cola), heillä on varmasti miljoona tai kaksi sisäistä arvostelua asiakkailta – nämä eivät ole vain kommentteja sosiaalisissa verkostoissa ja joitain mielipiteitä; Nämä ovat jonkinlaisia ​​sisäisiä järjestelmiä, arvioita ja niin edelleen.

Laki ei "tiedä" mitä henkilötiedot ovat!

  • Analysoimme yksinomaan avoimia tietolähteitä emmekä koskaan puutu mihinkään likaisiin temppuihin. Mallimme perustuu siihen, että tallennamme kaiken avoimen datan joihinkin julkisiin palvelinkeskuksiin, vuokraamme sen muualta ja analysoimme sitä kotona, toimistossamme, palvelimillamme, eikä se kulje minnekään alueen ulkopuolelle.

    Mutta lainsäädäntömme avoimen datan alalla on hyvin epämääräistä.

    Meillä ei ole selkeää käsitystä siitä, mitä avoin data on, mitä henkilötiedot ovat - on tämä 152. liittovaltion laki, mutta silti... Miten ne lasketaan? Nyt, jos minulla on nimesi ja puhelinnumerosi yhdessä tietokannassa, toisessa tietokannassa minulla on puhelinnumerosi ja sähköpostiosoitteesi, kolmannessa minulla on esimerkiksi sähköpostisi ja autosi; Kaikki tämä näyttää olevan ei-henkilökohtaista tietoa. Jos nämä kaikki yhdistetään, näyttää siltä, ​​että lain mukaan siitä tulee henkilötietoa.

    Kierrämme tämän kahdella tavalla. Ensimmäinen on asentaa palvelin ohjelmistolla asiakkaalle, ja sitten nämä tiedot eivät mene hänen alueensa ulkopuolelle, ja sitten asiakas on vastuussa näiden henkilötietojen, ei-henkilötietojen ja niin edelleen jakelusta. Tai toinen vaihtoehto: jos tämä on jonkinlainen tarina, jossa sinun täytyy haastaa sosiaalinen verkosto tai jotain muuta...

    Meillä oli tällainen tutkimus, kun keräsimme (yhtenäinen Venäjä esivaalit olivat) Lifenewsille näiden tovereiden selostuksia ja katsoimme, millaista pornoa he pitivät. Se oli hauska juttu, mutta silti. Myymme tämän omana, henkilökohtaisena mielipiteenämme, paljastamatta laillisesti asiakirjoissa analysoimaamme - yhtenäinen valtion oikeushenkilöiden rekisteri, palkat, sosiaaliset verkostot; Myymme asiantuntijalausuntoa, ja sitten sivussa selitämme henkilölle, mitä analysoimme ja miten.
    Tarinoita oli useita, mutta ne liittyivät joihinkin julkisiin kaupallisiin projekteihin. Meillä on esimerkiksi ilmainen voittoa tavoittelematon projekti longboardilla (sellaiset laudat ovat pitkiä) ajaville: tehtävänä oli kerätä ihmisten julkaisuja - kun joku julkaisee "Kävin Gorkin puistossa ajelulla". Ja nyt hänen pitäisi päästä kartalle, ja hänen ympärillään olevat ihmiset voivat nähdä, että joku on hänen lähellään. VK iski meille tästä aiheesta erittäin pitkään, koska he eivät pitäneet siitä, että julkaisemme näitä tietoja ilman ihmisten lupaa. Mutta sitten asia ei päässyt oikeuteen, koska useissa suurissa yhteisöissä lisäsimme sääntöihin, että tiedot saivat käyttää kolmannet osapuolet, virastot, yritykset, analyysit jne. Tietysti se ei ollut erityisen eettistä, mutta kuitenkin.

  • Tajusimme sen juuri ajoissa ja aloimme myydä asiantuntijalausuntoamme kaikille.

Työskenteletkö oppilaitosten kanssa?

  • Teemme yhteistyötä oppilaitosten kanssa, kyllä. Meillä on laaja valikoima: meillä on maisteriohjelma korkeakoulussa ja teemme yhteistyötä muiden yliopistojen kanssa. Rakastamme yliopistoja todella paljon!
  • Jos sinulla on yhteystietoni, voit kirjoittaa minulle. Ja linkki esitykseen, jos jotakuta kiinnostaa - kaikki nämä esimerkit ovat siellä, voit siirtää sen.
  • Jos tiedät puhelinnumeron, sähköpostin - tämä on melkein sataprosenttinen vaihtoehto, kukaan ei poista sitä. Jos puhelinnumeroa ei ole, se on yleensä kuva, jos kuvaa ei ole, vuosi, asuinpaikka, työpaikka. Eli vuoden, asuin- ja työpaikan mukaan lähes kaikki voidaan aina tunnistaa melko hienovaraisesti. Mutta tämä taas on kysymys tehtävästä.

    Meillä on esimerkiksi asiakas, joka myy Internet-televisiota. Joku osti heiltä näiden "Games of Thrones" -tilauksen, ja tehtävänä on käyttää heidän CRM:ään löytääkseen nämä ihmiset sosiaalisista verkostoista ja löytää sitten potentiaalisia heidän vaikutusalueeltaan. Tarkoitan vain sitä, että heillä on esimerkiksi etunimi, sukunimi ja sähköpostiosoite... Ja sitten on erittäin vaikeaa tehdä mitään. Useimmissa tapauksissa ihmiset voidaan löytää sähköpostitse.

  • Ystävien kokoonpanon perusteella me yleensä "tapamme" ihmisiä sosiaalisissa verkostoissa, mutta tämä ei aina pidä paikkaansa. Kyse ei ole siitä, etteikö se aina ole oikein – se ei aina toimi. Ensinnäkin tämä vaatii paljon työtä, koska tämä operaatio (ihmisten yhdistäminen) on suoritettava ensin jokaiselle ystäville - ymmärtääkseen, tulivatko he sosiaalisista verkostoista vai eivät. Ja sitten - kenellekään tuntematon tosiasia, että VKontaktessa meillä on samat ystävät, Facebookissa meillä on erilaisia ​​ystäviä. Ei kaikille, mutta esimerkiksi minulle se on näin; ja tämä pätee myös useimpiin ihmisiin.

Miten täydellisin data kerätään?

  • Ohjelmiston asentaminen asiakkaalle hänen puolellaan. Niihin on asennettu palvelin, joka ottaa meiltä vain julkisia tietoja ja käsittelee heidän henkilötietojaan sisäisesti. Asiakkaan kanssa tehdään NDA. Tämä ei tietenkään ole kovin oikein, että he siirtävät tämän meille, mutta oikeudellinen vastuu on asiakkaalla - eli ohjelmiston asentaminen hänelle tai anonyymien tietojen siirtäminen. Mutta tämä oli hyvin harvinaista, koska - oikea tai virheellinen anonymisointi - useimmissa tapauksissa riippuvuus näiden ihmisten välillä katoaa.

Kuka ostaa kasvojentunnistusohjelmiston?

  • Olemme itse asiassa menossa tänne, koska tärkein myymämme ohjelmistomme on kasvojenhaku, korrelaatioanalyysi, ja myymme sen valtion virastoille. Ja puolitoista vuotta sitten päätimme, että laitamme kaikki nämä tarinat mainontaan, markkinointiin, julkisille markkinoille - näin syntyi Social Data Hub, kaupallinen oikeushenkilö. Ja nyt ollaan vasta tulossa tänne. Olemme hengailleet täällä puolitoista vuotta ja yrittäneet selittää ihmisille, että ihmisille ei tarvitse antaa latauksia mainitsemalla, että heille on annettava vastauksia kysymyksiin, ettei tonaliteettia tarvita. , ja niin edelleen. Joten vaikea sanoa missä...
  • (Ketä tarkoitat?) Kaikille tovereille, joiden on etsittävä terroristeja ja pedofiilejä.
    Voin sanoa heti (tämä on seuraava kysymys): tietojemme mukaan ketään opettajaa ei vangittu uudelleenpostittamisesta.
  • VKontaktessa - 14%; Facebookissa ei ole suljettua profiilia sellaisenaan (suljettu ystäväluettelo ja niin edelleen). Ja mielenkiintoisin asia on, että kirjoitin juuri viestin - nyt he laskevat ja sanovat.

Älä postaa sellaista, mitä häpeät!

  • Älä julkaise sosiaalisiin verkostoihin mitään, mikä saa sinut häpeämään – seuraan tätä henkilökohtaisesti. Vaikka minulla oli paljon henkilökohtaisia, koska vannon Facebookissa. No, oli ja oli jotain tehtävää... Älä postaa mitään, mikä olisi noloa! Jos aiot myöhemmin työskennellä jossain julkisessa kammiossa, kyllä, on parempi olla kommentoimatta. Jos et aio tehdä tätä, kukaan ei yleensä välitä. Voin vain vakuuttaa, että kukaan ei lue henkilökohtaista kirjeenvaihtoasi, ja kaikki tämä rakentaa koko tarinaa...

    Joka viikko joku ehdottomasti tulee luokseni ja sanoo: "No, ystäväni valokuvat vuotivat jollekin nimettömälle julkiselle sivulle! Auta! Muuten, älä koskaan julkaise mitään nimettömillä julkisilla sivuilla.

  • Muista valvontajärjestelmistä en tiedä - otamme tämän ehdottomasti huomioon, että tuotemerkin maininta oli negatiivinen, Jumala anteeksi... Mutta voin sanoa, että kaikenlaiset valtionläheiset toverit ovat kiinnostuneita vain ihmisistä joiden yleisö on yli 5 tuhatta ja heidän julkinen mielipiteensä voi vaikuttaa johonkin, sitten vaikuttaa. Kokemukseni mukaan ei ole koskaan käynyt niin, että meiltä profiiliarviointeja tilaava henkilöstötoimisto sanoi: "Joka pitää Navalnysta, älä palkkaa ketään!"

Tietoja tulosten julkaisemisesta. Kuinka monta henkilöä työskentelee tutkimuksessa?

  • Kymmenen suurimman mainosyrityksen joukosta seitsemän julkaisee nyt. Vaikea sanoa: kun aloitimme tämän puolitoista vuotta sitten... Meillä on useita ihmisiä jokaisella alueella - pankeissa on useita ihmisiä, HR:ssä on useita, mainonnassa on useita ihmisiä. Ja nyt mietitään, kenelle on kannattavampaa mennä ensin, kenelle pitää alkaa tehdä jotain rajapintoja...
  • (henkilömäärä per markkinasegmentti) Enintään 25 henkilöä, koska emme raiskannut ketään.
  • Yleensä periaatteessa näitä markkinoilta tulevia teknologioita käytetään mielestäni yli 50 prosenttia. Jotkut mainoskampanjoissa, jotkut jonkinlaisessa sisäisessä analytiikassa. Sanoisin, että 40 prosenttia käyttää sitä sisäisessä analytiikassa, 50-60 prosenttia myy sitä loppumerkeille. Mutta tämä riippuu jo mainosyhtiöistä itsestään. Katsos, jotkut ihmiset raportoivat vain käytetyistä rahoista, mainostamisestaan, kun taas toiset kirjoittavat kuinka monta ihmistä he toivat, millaisen yleisön... Sanoisin niin, mutta voin olla väärässä - en. en todellakaan kuvittele kuinka kaikki nämä toverit toimivat. Tiedän vain määrällisistä tiedoista.

Muutamia mainoksia 🙂

Kiitos, että pysyt kanssamme. Pidätkö artikkeleistamme? Haluatko nähdä mielenkiintoisempaa sisältöä? Tue meitä tekemällä tilauksen tai suosittelemalla ystäville, pilvi VPS kehittäjille alkaen 4.99 dollaria, ainutlaatuinen lähtötason palvelimien analogi, jonka me keksimme sinulle: Koko totuus VPS (KVM) E5-2697 v3 (6 ydintä) 10 Gt DDR4 480 Gt SSD 1 Gbps alkaen 19 dollarista tai kuinka jakaa palvelin? (saatavana RAID1:n ja RAID10:n kanssa, jopa 24 ydintä ja jopa 40 Gt DDR4-muistia).

Dell R730xd 2 kertaa halvempi Equinix Tier IV -palvelinkeskuksessa Amsterdamissa? Vain täällä 2 x Intel TetraDeca-Core Xeon 2 x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV alkaen 199 dollaria Alankomaissa! Dell R420 - 2x E5-2430 2.2 Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - alkaen 99 dollaria! Lukea Kuinka rakentaa infrastruktuuriyritys. luokkaa Dell R730xd E5-2650 v4 -palvelimilla 9000 euron arvosta penniä vastaan?

Lähde: will.com

Lisää kommentti