Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

14. ožujka 2017. Arthur Khachuyan, CEO Social Data Huba, govorio je na predavanju BBDO-a. Arthur je govorio o inteligentnom nadzoru, izgradnji modela ponašanja, prepoznavanju foto i video sadržaja, kao io drugim Social Data Hub alatima i istraživanjima koja vam omogućuju ciljanu publiku pomoću društvenih mreža i Big Data tehnologija.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Arthur Khachuyan (u daljnjem tekstu – AH): - Zdravo! Bok svima! Moje ime je Arthur Khachuyan, vodim tvrtku Social Data Hub i bavimo se raznim zanimljivim intelektualnim analizama otvorenih izvora podataka, informacijskih polja i bavimo se svim vrstama zanimljivih istraživanja i tako dalje.

A danas su nas kolege iz BBDO Grupe zamolili da razgovaramo o modernim tehnologijama za analizu velikih podataka, velikih i ne tako velikih podataka za oglašavanje: kako se to koristi, pokažite nekoliko zanimljivih primjera. Nadam se da ćete usput postavljati pitanja, jer znam postati dosadna i ne otkriti bit i tako dalje, stoga nemojte se sramiti.

Zapravo, glavni pravci, gdje god su se koristila neka vrsta rješenja "gotovo velikih podataka", svi su jasni - to je ciljanje publike, analiza, provođenje neke vrste analitičkog marketinškog istraživanja. Ali uvijek je zanimljivo koji se dodatni podaci mogu pronaći, koja se dodatna značenja mogu pronaći nakon primjene analize.

Zašto nam je potrebna tehnologija za oglašavanje?

Gdje ćemo početi? Najočitija stvar je oglašavanje na društvenim mrežama. Danas sam ga skinuo ujutro: iz nekog razloga VKontakte misli da bih trebao vidjeti ovu konkretnu reklamu... Drugo je pitanje je li dobra ili loša. Vidimo da definitivno spadam u kategoriju vojnih obveznika:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Prva i najzanimljivija stvar koja se može uzeti kao tehnološko rješenje... Prvo što sam htio odlučiti prije nego što počnemo je definirati pojmove: što su otvoreni podaci, a što veliki podaci? Jer svi ljudi imaju svoje shvaćanje po tom pitanju i ne želim nikome nametati svoje uvjete, ali... Samo da ne bude razmimoilaženja.

Osobno mislim da su otvoreni podaci sve do čega mogu doći bez prijave ili lozinke. Ovo je otvoren profil na društvenim mrežama, ovo su rezultati pretraživanja, ovo su otvoreni registri itd. Big data, po mom vlastitom razumijevanju, ja to vidim ovako: ako je podatkovna pločica, to je milijarda redaka, ako je neka vrsta pohrane datoteka, to je negdje petabajt podataka. Ostalo u mojoj terminologiji nije big data, nego tako nešto.

Visokoprecizno profiliranje i bodovanje profila

Idemo redom. Prva i najzanimljivija stvar do koje možete doći analizom otvorenih izvora podataka je visokoprecizno profiliranje i bodovanje profila. Što je to? Ovo je priča u kojoj vaš račun na društvenoj mreži može predvidjeti ne samo tko ste, ne samo vaše interese.

Ali sada, kombinirajući različite izvore, možete saznati prosječnu razinu vaše plaće, koliko košta vaš stan i gdje se nalazi. I svi ti podaci mogu se koristiti doslovno iz dostupnih sredstava. Na primjer, ako uzmete svoj račun na društvenoj mreži, pogledajte, recimo, gdje živite, gdje radite; razumjeti u kojem se dijelu poslovanja nalazi tvrtka za koju radite; preuzmite slične natječaje s HH i “Superjob” ako ste analitičar, menadžer itd.; pogledajte gdje živite (baza, recimo CIAN), shvatite koliko košta unajmiti kuću u ovom mjestu, koliko košta kupiti kuću u ovom mjestu, predvidite otprilike koliko zarađujete. Nadalje, pomoću svojih društvenih mreža možete saznati koliko putujete, gdje se nalazite i koliko ste lojalni svom poslodavcu.

Sukladno tome, iz tako velikog broja metrika možemo napraviti što god želimo. Možemo vam predstaviti proizvod koji vas zanima. Možete li zamisliti online trgovinu? Odete tamo - ova online trgovina uhvati vaš račun na društvenoj mreži i kaže vam: "Maša, upravo si prekinula s dečkom, evo nekih proizvoda za tebe." Ovo nije bliska budućnost...

Kako se određuje geolokacija osobe?

Odgovori na pitanja iz publike:

  • Obično se 80% svih prijava smatra točnim mjestom stanovanja. Ali za ljude koji se nigdje ne čekiraju, postoji nekoliko opcija: ili check-in, ili geolociranje, ili je ovo analiza objava i objava za cijeli vremenski period kada je osoba nešto napisala... A negdje, iskočit će nešto poput "Želim kupiti kolica u blizini Akademicheskaya" ili "Nedavno sam ovdje vidio ružne grafite na zidu." Odnosno, za gotovo 80% ljudi njihovu geolokaciju, njihovo radno mjesto i mjesto stanovanja moguće je odrediti pomoću podataka ili metapodataka koji se mogu prikupiti s društvenih mreža.

    Ovo je, opet, analiza postova. U najjednostavnijem smislu, radi se o analizi check-ina i geolokacija na društvenim mrežama, koja ne briše jpeg metapodatke (iz toga možete nešto skužiti). Ali za ostale ljude, to su obično tekstualne emisije: ili osoba "svjetli" svoju lokaciju kada piše o nečemu, ili "sjaji" svoj telefon, po kojem možete pronaći neke od njegovih reklama na Avitu ili njegov račun na " Auto RU". Na temelju ovih podataka možete kombinirati (na primjer, "Prodajem auto u blizini Mayakovskaya") i grubo pretpostaviti ovo.

  • Ljudi to obično objavljuju na društvenim mrežama. Radimo samo s otvorenim izvorima i ovdje govorimo isključivo o otvorenim izvorima. Obično objavljuju oglase, odnosno u šezdeset posto slučajeva najčešća priča kada se ljudima “pokaže” trenutni broj mobitela su oglasi za prodaju nečega. Ili u nekim grupama osoba piše ("Tamo prodajem ovo ili ono") ili ide negdje.

    Da! Obično komentiraju: “Javi mi se ili mi pošalji SMS, nazovi moj broj. To se vrlo često događa ljudima koji nešto prodaju, kupuju na društvenim mrežama, komuniciraju s nekim... Sukladno tome, pomoću ovog broja onda možete na njega povezati njegov profil na CIAN-u, ako je ikada nešto objavio, ili, opet, na Avito. Ovo su jednostavno najpopularniji, vrhunski izvori, bit će dalje - to su Avito, CIAN i tako dalje.

  • Ovo se odnosi na internetsku trgovinu. Sljedeća će biti tehnologija prepoznavanja lica i usklađivanja profila (razgovarat ćemo o tome). Čisto teoretski, ovo se može primijeniti na offline trgovinu. I općenito, moj veliki san je da kada se pojave ulični transparenti, kada prođete pored kamere, ona vam “zarobi” lice. Ali ovaj će slučaj biti zakonom zabranjen jer se radi o povredi privatnosti. Nadam se da će se to dogoditi prije ili kasnije.
  • Iz osobnog iskustva. Vrlo često, kad vam netko nešto napiše, operirate nekim činjenicama iz njegova života koje kao da ne biste trebali znati... Ljudi se u većini slučajeva uplaše. Ali! Prema posljednjim statistikama, broj zatvorenih računa na društvenim mrežama smanjio se za 14%. Broj lažnjaka raste, broj otvorenih računa raste - ljudi sve više idu ka otvorenosti. Mislim da će za 3-4 godine prestati tako snažno reagirati na činjenicu da netko zna podatke o njima koje oni potencijalno ne bi trebali znati. Ali to je zapravo vrlo lako dobiti gledajući njegov zid.

Što se može preuzeti iz otvorenih izvora?

Postoji približan popis stvari koje se mogu razumjeti s prilično visokom pouzdanošću iz otvorenih izvora. Zapravo, postoji još više različitih metrika; ovisi o naručitelju takvog istraživanja. Postoji neka kadrovska agencija koju zanima psujete li na društvenim mrežama ili negdje u javnom prostoru. Nekoga zanima sviđaju li vam se publikacije Navaljnog ili, obrnuto, publikacije Jedinstvene Rusije ili neka vrsta pornografskog sadržaja - takve se stvari događaju prilično često.

Glavne su obiteljske vrijednosti, približna cijena stana, kuće, potraga za automobilom i tako dalje. Na temelju toga ljudi se mogu podijeliti u društvene skupine. Ovo su moskovski korisnici Tindera, tko su oni (prema njihovim slikama koje se nalaze na njihovim Facebook računima); na temelju svojih interesa podijeljeni su u različite društvene skupine:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ako se približimo oglašavanju, onda smo se polako udaljili od standardnog ciljanja oglašavanja, kada na VKontakteu odaberete da vas zanimaju 18-godišnji muškarci pretplaćeni na određene grupe. Sljedeća je ova slika, sad ću vam je pokazati:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Suština je da se većina trenutnih servisa koji analiziraju, u principu, ljude koji analiziraju društvene mreže, bave analizom interesa... Prvo što ljudima pada na pamet je analizirati top grupe svojih pretplatnika. Možda to nekima funkcionira, ali osobno mislim da je u osnovi pogrešno. Zašto?

Vaši lajkovi se prikupljaju i analiziraju

Sada uzmite telefone, pogledajte svoje top grupe - sigurno će biti više od 50% grupa na koje ste već zaboravili, to je nekakav sadržaj koji vam je zapravo nebitan. Uopće ga ne konzumirate, ali svejedno sustav će vas pratiti prema njima: da ste pretplaćeni na recepte, na neke popularne grupe. Odnosno, narušit ćete sustav koji analizira vaš profil, a vaši interesi neće biti opravdani.

Idemo dalje... Što je tu? Pretpostavljamo što drugi ljudi rade. Prema našem mišljenju, najadekvatniji način za procjenu interesa korisnika su lajkovi. Na primjer, na VKontakteu nema lajkova i ljudi misle da nitko ne zna što im se sviđa. Da, neki od lajkova su uvedeni na Instagramu, vidimo nešto na Facebooku, ali većina sadržaja u određenim grupama to ne emitira u zajedničkom feedu, a ljudi žive i misle da nitko neće znati što im se sviđa.

I prikupljanjem određenog sadržaja neke vrste koji nas zanima, prikupljanjem tih postova, prikupljanjem tih lajkova, zatim provjerom te osobe pomoću te baze podataka, možemo s velikom točnošću utvrditi tko je ona, kakva je njegova sudbina, što je zanima. Smjestite ga točno u određenu društvenu skupinu i komunicirajte s njim.

Kupnja automobila mijenja ponašanje

Imam takav primjer. Odmah ću reći da su moji primjeri skoro reklamni i skoro marketinški, jer, znate, većina slučajeva je zaštićena NDA i tako dalje. Ali bit će još puno toga zanimljivog. Dakle, priča s ovim ljudima: to su muškarci koji su kupili auto između 2010. i 2015. godine. Kako se njihovo društveno ponašanje na internetu promijenilo prikazano je bojom. Promijenio se postotak djevojaka među pretplatnicima, pretplatila sam se na “dječačke” javne stranice, našla stalnog seksualnog partnera...

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Cijela ova stvar je raščlanjena po marki automobila i broju ljudi. Odavde možete izvući mnoge zanimljive zaključke o ponašanju ljudi i kako sve to funkcionira. Mogu reći da su Porsche Cayenne i podmetnuta Priora gotovo identični po broju privučene publike. Kvaliteta te publike i njihovo ponašanje su različiti, ali je kvantiteta približno ista. Zaključak koji odavde možete izvući je što god želite, bliže vašem tržištu. Ako prodaješ Audi, napraviš slogan "Kupi Audi i bježi od roditelja!" i tako dalje.

Da, ovo je smiješan primjer činjenice da ponašanje ljudi na temelju analize lajkova, na temelju toga u koju grupu prelaze, koji sadržaj analiziraju - s gotovo 100% vjerojatnošću daje do znanja tko ste. Jer ako nemate pristup mrežnom prometu i ne čitate osobne poruke, lajkovi će vam uvijek reći tko je ta osoba - trudnica, majka, vojnik, policajac. A za vas, kao osobu koja se može reklamirati, ovo je veliki pogodak u metu.

Odgovori na pitanja iz publike:

  • Svaki stupac je broj ljudi u ovom automobilu; kako su se njihovi obrasci ponašanja promijenili. Pogledajte: ljudi koji su kupili Porsche Cayenne - otprilike 550 ljudi (žuto), porastao je postotak djevojaka među pretplatnicima.
  • Uzorak su korisnici društvenih mreža “Vkontakte”, “Facebook”, “Instagram” od 2010. do 2015. godine. Jedino pojašnjenje: ovdje odabrani automobili su oni koji se pomoću određenih alata mogu identificirati na fotografijama s više od 80% točnosti.
  • U određenom vremenskom periodu njegov auto (dobro, ne njegov, to ostavljamo društvenim mrežama)... U određenom vremenskom periodu osoba se stalno slikala s autom, bila s njim, objave bile su različite, fotografije su bile iz različitih kutova, i tako dalje. Tu će onda biti slika koji se ljudi slikaju s kojim automobilima i... Da, ovo je drugo pitanje - povjerenje u podatke društvenih mreža.
  • Otkad smo to spomenuli, nažalost, podaci društvenih medija nisu uvijek točni. Ljudi nisu uvijek skloni objaviti svoje podatke. Osobno sam proveo takvo istraživanje: usporedio sam broj diplomanata moskovskih sveučilišta s brojem ljudi registriranih na društvenim mrežama. U prosjeku je na društvenim mrežama registrirano 60% više ljudi - diplomanata Moskovskog državnog sveučilišta u određenoj godini u određenim specijalnostima - nego što ih zapravo ima u načelu. Tako da da - tu, naravno, postoji postotak grešaka i to nitko ne skriva. Ovdje jednostavno uzimamo kao osnovu one automobile koji se mogu identificirati s više od 80% vjerojatnosti.

Popis izvora za obuku modela

Ovdje je ogledni popis izvora koji se mogu koristiti, a koji se koristi da se s velikom sigurnošću odredi društveni profil osobe, tko je ona.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Uzimamo profil s društvenih mreža, s CIAN-a - cijena stana je otprilike, "Head-Hunter", "Superjob" - to je prosječna plaća za određenu osobu. Nadam se da ovdje nema predstavnika Head Huntera, jer smatraju da nije dobro uzimati te podatke od njih. Međutim, to je prosječna plaća u određenim regijama za određene vrste djelatnosti za slobodna radna mjesta.

“Avito”, “Avto.ru”: vrlo često ljudi, kada im svijetli telefon, sigurno imaju (u velikom broju slučajeva) barem nešto na “Avito”, ili na “Avto.ru”, ili na još nekoliko stranica s kojih možete saznati tko su. Ako su na ovaj broj telefona prodana kolica ili auto... Rosstat i Jedinstveni državni registar pravnih osoba su ipak više registri uz pomoć kojih možete rangirati tvrtku koja zapošljava - po nekoj formuli, po modelu koji bilo koja osoba može postaviti (možete otprilike odrediti novac te osobe itd.).

Tinder pomaže u prikupljanju podataka o situaciji u kojoj se nalaze ljudi

Osim toga, postoji tako zanimljiva stvar (alternativno, vrlo je smiješna u studiji) - ovo je, opet, prikupljanje podataka s moskovskog Tindera pomoću botova za ovaj Tinder. Utvrđena je udaljenost do ljudi, a potom i njihova približna lokacija.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Cilj ove studije bio je utvrditi broj Tinder računa na području državnih institucija - u Dumi, tužiteljstvu i tako dalje. Ali vi kao oglašivač možete zamisliti što god hoćete: može to biti, na primjer, Starbucks ili netko treći... Odnosno, broj ljudi na Tinderu koji kod vas piju kavu, nešto naručuju, nalaze se u trgovinama Što se tiče ove geolokacije: to se može učiniti s bilo kojom uslugom.

Odgovor na pitanje iz publike:

  • Kresivo? Ti ne znaš? Tinder je aplikacija za upoznavanje u kojoj gledate fotografije (lijevo-desno), a ova vam aplikacija pokazuje udaljenost do osobe. Ako dobijete udaljenost do te osobe s tri različite točke, možete približno (+ 5-7 metara) odrediti lokaciju. U ovom slučaju, za određivanje na području tužiteljstva ili Državne dume, nije tako teško. Ali opet, to može biti vaša trgovina, može biti bilo što.

Na primjer, davno, davno smo imali takav slučaj (nije studiju), kada smo od jednog od mobilnih operatera dobili podatke o gustoći prometa, podatke o gustoći kretanja ćelijskih točaka, a sve te informacije bile su superponirane na koordinatama reklamnih panoa koji se nalaze na autocestama . A zadatak mobilnog operatera je da otprilike utvrdi koliko ljudi prolazi i potencijalno bi moglo vidjeti ovu reklamu na jumbo plakatu.

Ako ovdje ima stručnjaka za billboard oglašavanje, možete reći: nemoguće je super pouzdano shvatiti - netko dolazi, netko nije gledao, netko je gledao... Ipak, ovo je primjer kako postoji 20 milijardi poligona ovi u Moskvi, na kojoj je gustoća tih ljudi u svakom satu na određenim rutama... U svakom trenutku možete vidjeti pored čega su ti ljudi prolazili i otprilike procijeniti protok putnika.

Odgovor na pitanje iz publike:

  • Takve podatke nitko ne daje. Proveli smo takvo istraživanje za jednog od operatera, ovo je isključivo interna priča, pa nažalost nije prikazana u obliku slika. Ali često velike reklamne agencije nemaju problema kontaktirati operatera. Barem u Moskvi postoje brojni presedani kada se, primjerice, osiguravajuća društva obraćaju tvrtkama poput GetTaxija, koje daju neosobne podatke o dobi vozača, načinu vožnje (dobro - loše, nepromišljeno - ne), kako bi predvidjeli politike i tako dalje. Svi se s tim bore, ali na nekoj internoj razini, davanje anonimnih podataka – mislim da nitko nema takav problem.

Prepoznavanje slika i uzoraka

Samo naprijed. Moj favorit je prepoznavanje slike. Bit će mali dio o traženju ljudi po licima, ali ovaj dio uglavnom ne uzimamo. Posebno se bavimo prepoznavanjem slike i utvrđivanjem što je na ovoj slici - marka automobila, njegova boja i tako dalje.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Imam ovaj smiješan primjer:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Postojala je takva studija o traženju tetovaža na raznim društvenim mrežama. Sukladno tome, isto se može primijeniti na bilo koju marku, na bilo koju vizualnu sliku, na gotovo svaku vizualnu sliku. Postoje oni koji se ne mogu pouzdano utvrditi (ne uzimamo ih).

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Evo moje omiljene. Automobilske marke vrlo često se okreću ovom zadatku jer je njihov zadatak, primjerice, pronaći sve vlasnike nekog BMW-a X6, shvatiti tko su, kako su međusobno povezani, što ih zanima i slično. To se odnosi na pitanje s kakvim se automobilima ljudi slikaju na društvenim mrežama.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ovdje uopće nije bilo filtriranja: objekt je bio njihov, auto nije bio njihov; To je samo kvar automobila - starost i tako dalje. Ali vizualno prepoznavanje slike koristi se prilično često: to je potraga za trudnicama i potraga za logotipom robne marke u nekakvim masovnim medijima (tko što objavljuje).

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Moj najdraži slučaj (koji koriste razni restorani): kakve se kiflice stavljaju na neku društvenu mrežu. To je smiješna stvar, ali zapravo vam omogućuje da shvatite mnogo zanimljivih stvari, prije svega, o vlastitim kupcima: tko vam je došao i zašto su to učinili. Jer nije tajna da se u sushi barovima većina ljudi (neću reći "djevojke") slikaju da bi se prijavili, pofotkali nešto i sl.

Marka to može iskoristiti. Brend zanima kakve proizvode treba lijepo fotografirati i objaviti, kakvi su ljudi tamo došli. Ova stvar se može napraviti s gotovo svime, od hrane.

Video prepoznavanje uzoraka

Odgovor na pitanje iz publike:

  • Ne na videu. Imamo ga u testnom načinu rada. Isprobali smo ovu tehnologiju, ali ispada da... Ona sve s videom dobro prepoznaje, ali nigdje joj nismo našli primjenu. Pozdrav. Osim analize koliko i koji video blogeri negdje pričaju... Bila je takva studija. Koliko se njihovih lica susreće, koliko često. Ali brendovi još nisu shvatili gdje to smisliti. Možda jednog dana i dođe.

Opet, ovo je hrana, mogu biti trudnice, muškarci (ne trudni), automobili - bilo što.

Kao opcija, bio je i novogodišnji studij za jedan medij. Također daleko od reklame, ali ipak. Evo kakva se hrana postila za Novu godinu:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ovdje je također raščlanjen po godinama. Vidi se takva korelacija da mladi uglavnom naručuju hranu, odrasli uglavnom prave tradicionalni stol. Smiješna je to stvar, ali zamišljajući to kao vlasnika brenda, možete procijeniti veliki broj stvari: tko i kako rukuje vašim proizvodom, što o njemu piše. Ljudi često ne spominju uvijek sam brend u tekstu, a tradicionalni analitički sustavi praćenja ne mogu uvijek razumjeti i pronaći ovo spominjanje brenda samo zato što se ne spominje u tekstu. Ili je tekst pogrešno napisan, nema hash oznaka ili bilo čega.

Fotografije su vidljive. S fotografijom možete znati je li to središnji subjekt kadra ili nije središnji subjekt kadra. Tada možete vidjeti što je ta osoba napisala. Ali najčešće se koristi kao potraga za potencijalnom publikom koja je vozila određene automobile i tako dalje. A onda ćemo napraviti puno zanimljivih stvari s tim autima.

Botovi su naučeni da oponašaju ljude

Postojala je i takva opcija za korištenje brojanja ljudi:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Postoji opcija za usporedbu ljudi, kada trebate pronaći ljude pomoću nekih fotografija, razumjeti njihov društveni profil, tko su. Opet se vraćamo na pitanje da ako imamo kameru u offline trgovini, onda je to prilično dobar način da shvatimo tko vam dolazi, tko su ti ljudi, što ih zanima, što ih je potaknulo da vam dođu .

Slijedi ono najzanimljivije: ako prikupimo njihove račune na društvenim mrežama, shvatimo tko su ti ljudi, što ih zanima, možemo (kao opciju) napraviti bota sličnog tim ljudima; ovaj bot će početi živjeti kao ovi ljudi i analizirati koje reklame vidi na raznim društvenim mrežama. To će vam omogućiti da točno shvatite koje su marke ciljane na tu osobu. Ovo je također prilično česta priča kada trebate ne samo analizirati tko je ta osoba i kakve interese ima, već i kakvu vrstu oglašavanja bi trebali ciljati vaši potencijalni konkurenti ili drugi zainteresirani ljudi.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Analiza veza na društvenim mrežama

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Sljedeća zanimljivost je analiza odnosa među ljudima. Zapravo, analiza veza u mreži, ti mrežni grafikoni - nema ništa, ništa novo u tome, to svi znaju.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ali primjena na zadatke oglašavanja je najzanimljivija. Ovo je potraga za ljudima koji postavljaju trendove, ovo je potraga za ljudima koji šire informacije prema određenim kriterijima unutar ove mreže. Recimo da nas zanimaju isti vlasnici određenog modela BMW-a. Spajajući ih sve zajedno, možemo pronaći one koji kontroliraju javno mnijenje. To nisu nužno automobilski blogeri i tako dalje. Obično su to jednostavni drugovi koji sjede na raznim javnim stranicama, zainteresirani su za neki sadržaj i mogu u vrlo kratkom roku privući vaš brend ili nekoga tko vas zanima u ovo područje odgovornosti, u područje ​kamate.

Ovdje je takav primjer. Imamo neke potencijalne ljude, veze među ljudima. Ovdje su narančaste osobe, male točkice su zajedničke grupe, zajednički prijatelji.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ako sakupite sve te veze između njih, možete vrlo jasno vidjeti da postoje ljudi koji imaju veliki broj zajedničkih grupa, zajedničkih prijatelja, oni su tu među sobom... A ako se ta ista vizualizacija podijeli na grupe po interesima, po sadržaju, koji distribuiraju, koliko međusobno komuniciraju... Ovdje možete vidjeti da je prethodna slika postala ovakva:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ovdje se skupine jasno razlikuju po boji. U ovom slučaju to su naši magistranti Visoke ekonomske škole. Ovdje možete vidjeti da su ljubičasto/plavi oni koji vole Transparency International, Otvorenu Rusiju i javne stranice Hodorkovskog. Dolje lijevo su zeleni, oni koji vole Jedinstvenu Rusiju.

Vidite da je prethodna slika bila ovakva (to su samo veze među ljudima), ali je postala jasno razgraničena. Odnosno, svi ljudi su uvijek povezani jedni s drugima, imaju iste interese, prijatelji su jedni drugima. Jedni su gore, drugi dolje, a tamo još neki drugovi. A ako se svaki od ovih malih podgrafova posebno vizualizira s drugim parametrima i gleda brzina širenja sadržaja (grubo rečeno, tko tu što repostira), u svakom dijelu možete pronaći jednu ili dvije osobe koje uvijek drže javno mnijenje u svojim rukama, interakcijom s kojim, traženjem da pošaljete neku vrstu objave ili nečim drugim - možete dobiti odgovor od cijele te zanimljive publike.

Imam još jedan takav primjer. Također grafikon: ovo su zaposlenici BBDO grupe pronađeni na društvenim mrežama kao primjer. Izgleda nezanimljivo, veliko, zeleno, veze među njima...

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ali imam opciju gdje su grupe već izgrađene između njih. Zatim, ako koga zanima, postoji interaktivna verzija - možete kliknuti i pogledati.

Gore desno su oni koji vole Putina. Ovdje su ljubičasti dizajneri; oni koje zanima dizajn, nešto zanimljivo i tako dalje. Ovdje su bijele stvari menadžerski tim (očigledno, koliko sam shvatio); Riječ je o ljudima koji, uglavnom, nisu ni na koji način povezani, ali rade na približno istim pozicijama. Ostalo su njihove zajedničke grupe, veze i tako dalje.

Brendovi ne trebaju blogere, već lidere mišljenja

Uzimamo te ljude i nalazimo ih - tada agencija za oglašavanje, tvrtka za oglašavanje odlučuje za sebe: može dati novac toj osobi da ona na neki način komunicira s tim sadržajem, nečim drugim, ili usmjeriti svoju specifičnu reklamnu kampanju na njih. Ovo se također često koristi, pogotovo sada, jer svi brendovi žele raditi s blogerima, žele da se njihov sadržaj promovira, ali reklamne agencije zapravo ne žele kontaktirati (dobro, to se događa).

A pravi izlaz iz ove situacije je pronaći ljude koji nisu blogeri, ne beauty blogeri, već na primjer, neka stvarna bića koja su u interakciji s ovim brendom, koja mogu napisati na nekoj jadnoj javnoj stranici “Mail.ru Answers”, dobiti određeni broj pregleda. Ti ljudi, koji su stalno zainteresirani za sadržaj te osobe, proširit će cijelu stvar, a brend će dobiti svoj angažman.

Druga opcija za korištenje takve tehnologije sada je vrlo relevantna - traženje botova, moj omiljeni. Ovo je reputacijski rizik za vaše konkurente i prilika da iz reklamne kampanje izbacite nebitne ljude i bilo što drugo (brisanje komentara i traženje poveznica među ljudima). Imam takav primjer, također je velik i interaktivan - možete ga pomicati. Ovo su veze ljudi koji su pisali komentare u zajednici Lentach.

Ovaj primjer služi da shvatite koliko su botovi dobro i lako vidljivi; a za to ne morate imati nikakvo tehničko znanje. To znači da je “Lentach” objavio post o istrazi FBK-a o Dmitriju Medvedevu, a neki su ljudi počeli pisati komentare. Prikupili smo sve ljude koji su napisali komentare - ti ljudi su zeleni. Sada ću ga premjestiti:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ljudi su zeleni (koji su pisali komentare). Ovdje su, ovdje su. Plave točke između njih su njihove zajedničke grupe, žute točke su njihovi zajednički pretplatnici, prijatelji i tako dalje. Većina ljudi je međusobno povezana. Jer, kakva god bila teorija o tri, četiri, pet rukovanja, svi su ljudi međusobno povezani na društvenim mrežama. Nema ljudi koji su odvojeni jedni od drugih. Čak su i moji socijalno fobični prijatelji koji koriste VKontakte isključivo za gledanje videa još uvijek pretplaćeni na neke od istih javnih stranica kao i mi.

Navalny također koristi botove. Svi imaju botove

Većina ljudi (ovdje je, ovdje) povezani su jedni s drugima. Ali postoji tako mala skupina suboraca koji su prijatelji isključivo jedni s drugima. Evo ih, zelenih malih, evo im zajedničkih prijatelja i grupa. Ovdje su čak i otpali odvojeno:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

I sretnom slučajnošću, upravo ti ljudi koji su ispod ove objave napisali: “Navalni nema dokaza” i tako dalje, napisali su iste komentare. Naravno, ne usuđujem se donositi zaključke. Ali unatoč tome, imao sam još jednu objavu na Facebooku, kad je bila rasprava između Lebedeva i Navaljnog, analizirao sam komentare na isti način: pokazalo se da svi ljudi koji su napisali "Lebedev je sranje", nisu bili na društvenim mrežama mrežama zadnjih četiri mjeseca, nije bio pretplaćen ni na jednu javnu stranicu, iznenada je otišao na ovu objavu, napisao točno ovaj komentar i otišao. Opet, nemoguće je izvlačiti zaključke odavde, ali netko iz Navaljnog tima mi je napisao komentar da oni ne koriste botove. Pa dobro!

Bliže reklami, bliže brendu. Sada svi imaju botove! Imamo ih mi, imaju ih naši konkurenti, imaju ih i drugi. Moraju se izbaciti ili ostaviti da dobro žive; Na temelju takvih podataka (pokazuje na prethodni slajd) dovedite ih do savršenstva da izgledaju kao stvarne osobe i tek onda ih koristite. Iako je korištenje botova loše! Ipak, prilično česta priča...

U automatskom načinu rada, takva vam stvar omogućuje da iz svoje analize filtrirate ljude koji nisu relevantni za analizu, ljude koji ne bi trebali biti uključeni u uzorak, ne bi trebali biti uključeni u ovu studiju. Vrlo često korišten. Pa opet, ne posjeduju svi vlasnici automobila automobile. Ponekad ljude zanimaju samo ljudi koji potencijalno imaju auto, koji sjede u nekim grupama, komuniciraju s nekim, imaju tu određenu publiku.

Analiza činjenica i mišljenja

Sljedeći koji imam mi je također najdraži. Ovo je analiza činjenica i mišljenja.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Danas svatko zna spomenuti svoj brend u raznim izvorima. Nema tajne u tome. I čini se da svatko može izračunati tonalitet... Iako osobno mislim da sama metrika tonaliteta nije baš zanimljiva, jer kada dođete i kažete klijentu: "Čovječe, imaš 37% neutralno", a on to kaže , “ Vau! Cool!" Stoga bi bilo zanimljivije pomaknuti se malo dalje: od procjene sentimenta do procjene mišljenja onoga što govore o vašem proizvodu.

I to je također vrlo zanimljiva stvar, jer... Ja osobno smatram da u principu ne može biti neutralnih poruka, jer ako čovjek nešto napiše u javnom prostoru, ta poruka je na bilo koji način obojena. Ja osobno nikada nisam vidio neutralnu poruku u kojoj se spominje brend. Obično je to neka vrsta prljavštine.

Ako uzmemo velik broj tih poruka (moglo bi ih biti milijune, 10 milijuna), iz svake poruke izdvojimo glavnu ideju, spojimo ih, možemo prilično pouzdano razumjeti što ljudi govore o ovom brendu, što misle. "Ne sviđa mi se pakiranje", "Ne sviđa mi se konzistencija" i tako dalje.

Što ljudi misle o Transaeru, Chupa Chupsu i predsjedniku Sjedinjenih Država?

Imam jedan smiješan primjer: ovo je infografika o tome što bi korisnici društvenih mreža radili s tvrtkom Transaero nakon njenog bankrota.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ima tu mnogo zanimljivih primjera: spaliti, ubiti, deportirati u Europu, bilo je čak 2% onih koji su napisali - "Pošaljite ih u Siriju u vojne operacije." Da nastavimo sa smiješnom stvari, to može biti gotovo bilo koja marka - od moje omiljene hrane za pse do nekih automobila. Kome se pakiranje ne sviđa, tko ne voli prave stvari - s tim se uvijek može raditi, s tim se uvijek može voditi računa. Velik je broj primjera kada su ljudi skoro promijenili proizvodnju svojih proizvoda jer su na društvenim mrežama pisali da Chupa Chups nije dovoljno okrugao ili da nije dovoljno sladak.

Postoji još jedan smiješan primjer. Pogodite koji komentari i o kome?

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Iz nekog razloga, sada se analiza mišljenja, analiza činjenica izvučenih iz poruka, malo koristi i nije jako raširena. Iako ova tehnologija nije supertajna, praktički nema nikakvog znanja i iskustva u tome, jer iz komentara ljudi, izdvajanje subjekta, predikata i njihovo grupiranje ne zahtijeva genijalca računalne lingvistike. Nije to tako teško napraviti. Ali nadam se da će u sljedećih nekoliko godina ljudi početi koristiti ovo, jer... Bit će super - ovo je takva automatska povratna informacija! Uvijek znate što govore o vama. Pa, razumijete da je ovo napravljeno o američkom predsjedniku.

Odgovor na pitanje iz publike:

  • Da, ovo je Facebook na engleskom. Ovdje su prevedeni na ruski. Ovo je negdje napisano.

Big Data i političke tehnologije

Zapravo, imam mnogo različitih zanimljivih primjera politike o Trumpu i svima drugima, ali odlučili smo ih ne donositi ovdje. Ali postoji jedan politički primjer.

Ovo su izbori za Državnu dumu. kad si bio Prošle godine? Prije skoro godinu i pol.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ovdje su ljudi koji su mogli odrediti svoju točnu lokaciju, do određene geotočke, kako bi shvatili u koju izbornu jedinicu spadaju. I onda su od tih ljudi uzeti samo oni koji su izrazili svoje određeno mišljenje, za koje bi glasali.

Političkotehnološki gledano, to nije baš točno, jer tu cijelu stvar treba normalizirati po gustoći naseljenosti i tako dalje. Ipak, plavi će ovdje glasati za znate koga, crveni će glasati za oporbene drugove kojih, uzgred budi rečeno, nije bilo puno.

Osobno vjerujem da Big Data neće tako skoro stići do političkih tehnologija, ali, kao opcija, kandidat je i brend. A ovo je donekle i analiza činjenica i mišljenja o vašem brendu, i prilično zanimljiva stvar, jer u stvarnom vremenu možete razumjeti tko što radi. Znam nekoliko slučajeva s BBC-a, kada su u nekom prijenosu pratili društvene mreže u realnom vremenu: bio je takav i takav odgovor, ljudi pišu o tome, postavljaju to i to pitanje - i to je super! Mislim da će se vrlo brzo koristiti, jer je svima zanimljiv.

Modeliranje pozicija marke

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Sljedeće je modeliranje pozicija brenda. Mali, kratki članak o tome kako možete rangirati brendove koristeći različite metrike (ne lajkove pretplatnika na društvenim mrežama, već koristeći složene metrike, interes za sadržaj, vrijeme provedeno u primanju metrika).

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Imam primjer "pharma" iz određenog razloga. Ovdje su mali krugovi unutarnji, svijetli - to je količina tekstualnog sadržaja koju sam brend stvara, veliki krug je količina foto i video sadržaja koji sam brend stvara.

Blizina centra pokazuje koliko je sadržaj zanimljiv publici. Postoji veliki model, postoji hrpa svakakvih parametara: lajkovi, repostovi, vrijeme odgovora, tko je tu podijelio u prosjeku... Ovdje možete vidjeti: postoji divan “Kagotsel”, koji pumpa ogromnu količinu novca u stvaranje vlastitog sadržaja, a zbog toga su dosta blizu centra. A ima drugova koji također stvaraju svoj sadržaj, ali to publiku ne zanima. Ovo nije baš primjeren primjer, jer su svi ti računi praktički mrtvi.

Yegor Creed je voljen više od Baste

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Nažalost, ostalo ... od onoga što pokazati ... Pa, tu su i ruski reperi, kao opcija, iz pravih kompanija.

Što je plus? Činjenica je da tvrtka može staviti gotovo sve u takav model, počevši od prosječne plaće pretplatnika koji rade za vaš brend; bilo koji model koji im se sviđa. Budući da svaka agencija za oglašavanje drugačije izračunava vlastite metrike, robne marke drugačije izračunavaju vlastite metrike.

Tu je i jedan - Basta, koji generira veliku količinu sadržaja, ali se nalazi na periferiji, jer ti sadržaji naizgled nisu previše zanimljivi publici. Opet, ne usuđujem se osuđivati. No, ipak, tu je Yegor Creed, koji je, prema društvenim mrežama, gotovo najbolji izvođač našeg vremena, ali objavljuje samo svoje osobne fotografije. Ipak, ima velik broj pretplatnika: ima ih negdje oko milijun. Ne sjećam se točnog broja; Sjećam se da je postotak angažmana tih ljudi puno veći od 85%, odnosno na milijun pretplatnika dobije 850 tisuća odgovora od tih stvarnih ljudi - to je prava ludnica. To je istina.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Odgovori na pitanja iz publike:

Koliko je vremena trebalo da se napravi model analize repera?

  • Svaki ima svoju ciljanu publiku, za svakoga su proračunati interesi tih ljudi... Sve je to normalizirano na udaljenost od centra otprilike, njihov radijalni položaj nije bitan (ovdje je jednostavno zamazano radi ljepote, tako da se da se ne zalijeću). Bitna je samo približna blizina centra. Ovo je model koji koristimo. Na primjer, meni se više sviđa krug, neki ljudi to rade na umu kao polukrug.
  • Ovaj model je sastavljen brzo, za dva-tri sata (da, jedna osoba). Ovdje su umetnute samo metrike: što pomnožimo s čime, zbrojimo i onda nekako normaliziramo. Ovisi o modelu. Postoje ljudi koje zanima prosječna plaća (ovo nije šala) njihovih pretplatnika. A za ovo trebate pronaći njihove kontakte, Avito, sve izračunati, pomnožiti. Dešava se da ovo treba dugo da se uzme u obzir, ali konkretno ovo (pokazuje na prethodni slajd) - parametri su ovdje vrlo jednostavni: pretplatnici, repostovi i tako dalje. Bilo je potrebno oko dva do tri sata da se završi. Sukladno tome, ta stvar se zatim ažurira u stvarnom vremenu i možete je koristiti.

Sada dolazi zabavni dio. Završio sam s primjerima, jer nije zanimljivo pričati dugo nasamo. I nadam se da ćete sada postavljati pitanja, pa ćemo zapravo ići s teme na temu, jer imam takve primjere kako se tehnologije mogu koristiti i tako dalje...

Odgovori na pitanja iz publike:

  • Imao sam jedan jedini osobni slučaj s jednim, da tako kažem, “blizu kasina”, kada je tamo postavljena kamera, prepoznavana lica i tako dalje. Postotak ljudi koji su prepoznati je svakako prilično velik – kako naših tako i naše konkurencije. Ali zapravo je vrlo zanimljivo. Vidim ovo kao zanimljivu stvar: možete razumjeti tko su ti ljudi i prilično dobro predvidjeti zašto su točno došli ovdje, što se toliko promijenilo u njihovim životima da su odlučili doći u kasino. Ali što se tiče specifičnih vrsta poslovanja... Ako tako nešto stavite u apoteku, onda nema smisla - ne možete predvidjeti zašto je osoba došla u apoteku.

    Ovdje je globalni zadatak bio izgraditi model kako biste razumjeli kada se osoba potencijalno želi zainteresirati za vaš brend, tako da mu možete dati reklamu ne nakon što je nešto kupio (kao što se sada događa), već mu dati reklamu “ u prognozi” kada će se sve to dogoditi. Bilo je zanimljivo s takvim “near-casinom”; pokazao se prilično zanimljiv postotak tih ljudi - zašto: netko je iznenada dobio promaknuće, netko je dobio nešto treće - takve zanimljive spoznaje. Ali s nekim trgovinama, s maloprodajom, s trgovinom nekakvih tableta, čini mi se da to neće biti baš ispravno.

Koristi li se Big Data izvan mreže?

  • Bilo je offline. Samo trebate točno razumjeti, otprilike, hoće li ovaj model odgovarati ili ne. Opet gazirana voda... Mene zapravo sve zanima, ali osobno ne razumijem koliko, koliko profili tih ljudi, njihovo ponašanje može ovisiti o tome kada žele kupiti flaširanu vodu. Iako bi ovo stvarno moglo biti istina, ne znam.

Koliko ima otvorenih računa na društvenim mrežama?

  • Konkretno imamo 11 društvenih mreža - to su "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagram" i neke sitnice (mogu pogledati popis, poput "Mail.ru" i tako dalje) . Na VKontakteu definitivno imamo kopiju svih ovih drugova. Imamo ljude na VKontakteu - to je 430 milijuna svih koji su ikada postojali (od kojih je oko 200 milijuna stalno aktivno); postoje grupe, postoje veze među tim ljudima i postoji sadržaj koji nas zanima (tekst), i jedan dio medija, ali vrlo mali... Grubo rečeno, gledamo ovu sliku: ako tu ima lica, mi spremite ih, ako postoji meme, spremimo ih. Ne spremamo ga, jer ni mi ne bismo imali dovoljno da spasimo medijski sadržaj.

    Postoji Facebook na ruskom jeziku. Negdje sada 60-80% su Odnoklassniki, za par mjeseci ćemo ih vjerojatno sve do kraja. Ruski Instagram. Za sve te društvene mreže postoje grupe, ljudi, veze između njih i tekst.

  • Oko 400 milijuna ljudi. Postoji suptilnost: postoje ljudi čiji grad nije naveden (potencijalno su Rusi / neRusi); Od toga je prosjek za društvene mreže 14% zatvorenih računa na VKontakteu, ne znam točnu brojku na Facebooku.
  • Također ne spremamo medije na Instagramu - samo ako tamo ima lica. Takav (drugi) medijski sadržaj ne pohranjujemo. Obično zanimljivo: samo tekst, veze među ljudima; Svi. Najčešće istraživanje na Instagramu je uobičajeno istraživanje publike: tko su ti ljudi i, što je najvažnije, povezanost tih ljudi s drugim društvenim mrežama. Pronađite profil te osobe na Vkontakteu i Facebooku kako biste izračunali njegovu dob i tako dalje.
  • Još nema potrebe preuzimati sve ostale - jednostavno zato što nema kupaca. Što se tiče jezika: imamo ruski, engleski, španjolski, ali ipak se ovo koristi isključivo za marke iz Rusije; dobro, ili tvrtke koje ih dovoze iz Rusije.
  • Intervjuiramo ljude svaki dan u mnogo, mnogo, mnogo niti: podatke prikupljamo prikupljanjem na webu i ažuriramo te pokazatelje pomoću API-ja. Za 2-3 dana možete proći kroz cijeli "VKontakte", prolazeći kroz njih; Za otprilike tjedan dana možete proći kroz cijeli Facebook i shvatiti tko je što ažurirao, a što nije. I onda ponovo okupite te ljude zasebno: što se točno promijenilo, zapišite cijelu ovu priču. Prema mom iskustvu, vrlo rijetko se nečiji stari profil na društvenim mrežama koristio u stvarne poslovne svrhe. To je bilo vrijeme kada se prijavio jedan politički lik, čiji je zadatak bio shvatiti kakvi ljudi dolaze u stožer, tko su ti ljudi prije 6-8 mjeseci (jesu li izbrisali profil, a zapravo su za drugog kandidata stigli listići plijen).

    I nekoliko puta - osobne priče kada su nečije fotografije objavljene u javnoj domeni. Trebalo je pronaći veze itd. Nažalost, šteta, ali ne možemo svjedočiti na sudu, jer je naša baza podataka pravno nelikvidna.

  • MongoDB pohrana mi je najdraža.

Društvene mreže pokušavaju se boriti protiv prikupljanja podataka

  • Obično oglašivačima prenosimo samo popis tih računa, a onda oni koriste standardni... To jest, na društvenim mrežama, na VKontakteu, možete odrediti popis tih ljudi.

    Ali Facebook koristi kupljene kolačiće. Mi sami ne radimo s kolačićima, ali bilo je nekoliko priča kada je sam oglašivač dao neke ljude, mi smo s njima komunicirali - oni imaju te mreže, s teaser oglašavanjem, neteaser oglašavanjem, te "kolačiće". Možete ga vezati - nema sumnje! Ali ja baš ne volim ove stvari jer ne mislim da su baš autentične. Ovo je čisto po meni, to je kao TNS koji “prati” TV-e - nije jasno gledaš li tu TV ili ne, pereš li suđe dok ti je TV uključen... I ovdje je tako : Vrlo često guglam nešto na internetu, ali to ne znači da to želim kupiti.

  • Ako koristite neku vrstu standardne mreže za kontekstualno oglašavanje: Imao sam nekoliko priča kada smo im iskrcali te ljude i pokušali ih, koristeći njihova sučelja, povezati s "kolačićima" na njihovim stranicama. Ali ja baš i ne volim takve stvari.

Formula za izračun plaće korisnika interneta

  • Opća formula za prosječnu plaću: ovo je regija u kojoj osoba živi, ​​ovo je kategorija poslovanja u kojoj radi (odnosno tvrtka koja mu je poslodavac), zatim se uzima njegova pozicija u toj tvrtki, prosjek plaća za ovu poziciju je procijenjena... Prosječna plaća preuzeta iz “Head Hunter” i “Superjob” (i postoji nekoliko drugih izvora) za dano slobodno radno mjesto u datoj regiji i za dani poslovni kontekst.

    Iz “Avito” i “Avto.ru” obično se uzimaju dodatni parametri ako je osoba osvijetlila telefon. Uz Avito možete vidjeti kakve stvari osoba prodaje - skupe, jeftine, rabljene, nekorištene. S "Avto.ru" možete vidjeti ima li auto - posjeduje ga, ne posjeduje ga. To je negdje manje od 20% ljudi kojima je telefon slučajno negdje ispao, a njihov račun se može povezati s ovim podacima.

S kojim količinama radi tvrtka za prikupljanje podataka?

  • Volumen pohranjenih fotografija u petabajtima je 6,4. Ne mogu sada točno reći stopu rasta, jer smo 2016. počeli snimati "periskope" i tek počeli snimati video.

    Ne mogu točno reći kada je bila nula. Selili smo se iz firme u firmu – sve su to duge priče. Ali mogu reći da VK, Facebook, Instagram i Twitter - sav ovaj posao (ljudi, grupe i veze između njih) s tekstom i sadržajem - to zapravo nije puno podataka, malo je vjerojatno da je čak i petabajt dobio dovoljno. Mislim da ima 700 gigabajta, vjerojatno 800.

Pomažete li klijentima odrediti trenutnu nišu i gdje kopati?

  • Kad klijent dođe, mi mu takve stvari sugeriramo, ali mi sami, poput Google Trendsa, takve stvari ne radimo.
  • Imali smo nekoliko skoro socioloških priča, s izbornom, predizbornom poviješću – sve smo to analizirali. Kod brendova i procjenjivanja mišljenja o brendovima gotovo uvijek se sve slaže. Eto izborno-izborne priče – ne (s procjenom koji bi kandidat trebao pobijediti). Ne znam tko ovdje griješi - mi ili oni koji misle u VTsIOM-u.
  • Obično mi te rezultate kontrole uzimamo od samog brenda, oni to uzimaju od drugova koji naručuju istraživanja - telefonska istraživanja, marketinška istraživanja i tako dalje. Plus, cijela se stvar može provjeriti osnovnim stvarima: netko je odgovarao na mailing listu, netko je radio ankete... Ako se radi o velikom brendu (Coca-Cola, na primjer), sigurno ima milijun-dva internih recenzija kupaca – ovo nisu samo komentari na društvenim mrežama i neka mišljenja; To su nekakvi interni sustavi, recenzije i tako dalje.

Zakon ne “zna” što su osobni podaci!

  • Analiziramo isključivo otvorene izvore podataka i nikad se ne upuštamo u bilo kakve prljave trikove. Naš model je izgrađen na činjenici da sve otvorene podatke pohranjujemo u neke javne podatkovne centre, iznajmljujemo ih negdje drugdje i analiziramo kod kuće, u našim uredima, na našim serverima i ne idu nigdje izvan teritorija.

    No naša zakonska regulativa u području otvorenih podataka vrlo je nejasna.

    Nemamo jasno razumijevanje što su otvoreni podaci, što su osobni podaci - postoji taj 152. savezni zakon, ali ipak... Kako se oni broje? Sad, ako u jednoj bazi podataka imam tvoje ime i broj telefona, u drugoj bazi imam tvoj broj telefona i tvoj e-mail, u trećoj imam, recimo, tvoj e-mail i tvoj auto; Čini se da su sve ovo neosobni podaci. Kad se sve to zbroji, čini se da će po zakonu postati osobni podaci.

    Ovome zaobilazimo na dva načina. Prvi je instalirati poslužitelj sa softverom za klijenta, a zatim ti podaci ne izlaze izvan njegovog teritorija, a zatim je klijent odgovoran za distribuciju tih osobnih podataka, neosobnih podataka i tako dalje. Ili druga opcija: ako je ovo neka priča u kojoj treba tužiti društvenu mrežu ili nešto treće...

    Imali smo takvu studiju kada smo prikupljali (bilo je predizbora Ujedinjene Rusije) za Lifenews račune tih drugova i gledali kakvu pornografiju vole. Bilo je to smiješno, ali ipak. Ovo prodajemo kao svoje vlastito, osobno mišljenje, bez pravnog otkrivanja u dokumentima onoga što smo analizirali - Jedinstveni državni registar pravnih osoba, plaće, društvene mreže; Prodajemo stručno mišljenje, a onda u kuloarima objasnimo osobi što smo i kako analizirali.
    Bilo je nekoliko priča, ali su se odnosile na neke javne komercijalne projekte. Na primjer, imamo besplatni neprofitni projekt za one koji voze longboarde (takve su daske dugačke): zadatak je bio prikupiti publikacije ljudi - kada netko objavi "Išao sam u park Gorky na vožnju." I sada bi trebao doći na kartu, a ljudi oko njega mogu vidjeti da je netko blizu njega. VK se dugo sukobljavao s nama na ovu temu, jer im se nije sviđala činjenica da objavljujemo te informacije bez dopuštenja ljudi. Ali tada stvar nije došla do suda, jer smo unutar nekoliko velikih zajednica dodali u pravila da podatke mogu koristiti treće strane, agencije, tvrtke, analize itd. Naravno, nije to bilo posebno etično, ali ipak.

  • Samo smo to na vrijeme shvatili i počeli svima prodavati naše stručno mišljenje.

Surađujete li s obrazovnim institucijama?

  • Surađujemo s obrazovnim institucijama, da. Imamo cijeli niz: imamo magistarski studij na Visokoj školi, surađujemo s drugim sveučilištima. Jako volimo sveučilišta!
  • Ako imate moje kontakte, možete mi pisati. I link na prezentaciju, ako nekoga zanima - svi ovi primjeri su tu, možete ga premjestiti.
  • Ako znate telefonski broj, poštu - ovo je gotovo stopostotna opcija, nitko je neće ukloniti. Ako nema broja telefona, to je obično slika, ako nema slike, to je godina, mjesto stanovanja, posao. Odnosno, po godinama, mjestu stanovanja i radu, gotovo se svatko uvijek može prilično suptilno identificirati. Ali ovo je, opet, pitanje o zadatku.

    Imamo, recimo, klijenta koji prodaje internet televiziju. Netko je od njih kupio pretplatu na te “Igre prijestolja”, a zadatak je pomoću njihovog CRM-a pronaći te ljude na društvenim mrežama, a zatim pronaći potencijalne iz njihovog područja utjecaja. Mislim samo da imaju, recimo, ime, prezime i e-mail... I onda je jako teško bilo što napraviti. U većini slučajeva ljude je moguće pronaći putem e-maila.

  • Na temelju sastava naših prijatelja obično “spajamo” ljude na društvenim mrežama, no to nije uvijek točno. Nije da nije uvijek u redu – ne funkcionira uvijek. Prvo, ovo zahtijeva puno rada, jer će se ova operacija (spajanje ljudi) morati prvo provesti za svakog od prijatelja - da se shvati jesu li došli s društvenih mreža ili ne. I onda - nikome nepoznata činjenica da na VKontakteu imamo iste prijatelje, a na Facebooku imamo različite prijatelje. Ne za svakoga, ali za mene je, na primjer, ovako; a to vrijedi i za većinu ljudi.

Kako se prikupljaju najpotpuniji podaci?

  • Instalacija softvera za klijenta na njegovoj strani. Na njima je instaliran poslužitelj koji od nas preuzima samo javne podatke, a njihove osobne podatke obrađuje interno. NDA se sklapa s klijentom. To, naravno, nije točno da oni to prenose nama, ali zakonska odgovornost leži na klijentu - dobro, to jest, instalirati softver za njega ili prenijeti anonimne podatke. Ali to je bilo vrlo rijetko, jer - ispravna ili netočna anonimizacija - u većini slučajeva gubi se ovisnost između tih ljudi.

Tko kupuje softver za prepoznavanje lica?

  • Zapravo idemo ovamo jer je naš glavni softver koji prodajemo pretraživanje lica, analiza korelacije i prodajemo ga vladinim agencijama. I prije godinu i pol smo odlučili da ćemo sve te priče staviti u oglašavanje, u marketing, na javno tržište - tako je nastao Social Data Hub, komercijalna pravna osoba. A sad tek dolazimo ovamo. Tu se družimo već godinu i pol, pokušavamo objasniti ljudima da nema potrebe davati ljudima downloade uz spomen, da im treba dati odgovore na pitanja, da nema potrebe za tonalitetom. , i tako dalje. Tako da je teško reći gdje...
  • (Na koga misliš?) Svim drugovima koji trebaju tražiti teroriste i pedofile.
    Odmah mogu reći (to će biti sljedeće pitanje): prema našim podacima nijedan učitelj nije bio zatvoren zbog ponovnog objavljivanja.
  • Na VKontakteu - 14%; na ​​Facebooku nema zatvorenog profila kao takvog (postoji zatvorena lista prijatelja i tako dalje). I što je najzanimljivije, upravo sam napisao poruku - sad će oni brojati i reći.

Nemojte objavljivati ​​nešto čega ćete se sramiti!

  • Ne objavljujte na društvenim mrežama ništa čega biste se sramili – osobno to pratim. Iako sam imao dosta osobnih, jer kunem se na fejsu. Pa, bilo je i trebalo je nešto učiniti... Ne objavljujte ništa što bi bilo neugodno! Ako ćeš kasnije raditi negdje u Javnoj komori, da, bolje da ne komentiraš. Ako to nećete učiniti, uglavnom, nikoga nije briga. Mogu vas samo uvjeriti da nitko ne čita vašu osobnu korespondenciju, a sve to gradi cijelu ovu priču...

    Svaki tjedan mi sigurno netko dođe i kaže: “Pa fotografije mog prijatelja su procurile na neku anonimnu javnu stranicu! Pomozite! Usput, nikada ništa ne objavljujte na anonimnim javnim stranicama.

  • Za druge sustave nadzora ne znam - svakako ćemo to uzeti u obzir, da je spominjanje brenda bilo negativno, Bože me oprosti... Ali mogu reći da svakakve pridržavne drugove zanimaju samo ljudi. koji imaju publiku veću od 5 tisuća, a njihovo javno mnijenje može utjecati na nekoga.onda utjecati. Po mom iskustvu, nikada se nije dogodilo da HR agencija koja od nas naručuje procjenu profila kaže: “Tko voli Navaljnog, neka nikoga ne zapošljava!”

O objavi rezultata. Koliko je ljudi zaposleno u istraživanju?

  • Od 10 najboljih oglašivačkih tvrtki, sedam ih sada objavljuje. Teško je reći: kad smo krenuli s ovim prije godinu i pol... U svakom području imamo nekoliko ljudi - u bankama je nekoliko ljudi, u HR je nekoliko ljudi, u oglašavanju je nekoliko ljudi. I sad razmišljamo kome je isplativije prvo otići, kome treba krenuti u izradu nekih sučelja...
  • (o broju ljudi po tržišnom segmentu) Ne više od 25 ljudi, jer nismo nikoga silovali.
  • Općenito, u principu, te tehnologije s tržišta koriste se, mislim, više od 50%. Neki u reklamnim kampanjama, neki u nekakvoj internoj analitici. Rekao bih da ga 40 posto koristi u internoj analitici, 50-60 % ga prodaje krajnjim brendovima. Ali to već ovisi o samim oglašivačkim tvrtkama. Vidite, neki se prijavljuju jednostavno zbog potrošenog novca, oglašavanja koje su postavili, dok drugi pišu koliko su ljudi doveli, kakvu publiku... Rekao bih, ali možda griješim - ne stvarno ne možete zamisliti kako svi ti drugovi rade. Znam samo u kvantitativnim podacima.

Neki oglasi 🙂

Hvala što ste ostali s nama. Sviđaju li vam se naši članci? Želite li vidjeti više zanimljivog sadržaja? Podržite nas narudžbom ili preporukom prijateljima, cloud VPS za programere od 4.99 USD, jedinstveni analog poslužitelja početne razine, koji smo izmislili za vas: Cijela istina o VPS (KVM) E5-2697 v3 (6 jezgri) 10GB DDR4 480GB SSD 1Gbps od 19 USD ili kako podijeliti poslužitelj? (dostupno s RAID1 i RAID10, do 24 jezgre i do 40 GB DDR4).

Dell R730xd 2 puta jeftiniji u Equinix Tier IV podatkovnom centru u Amsterdamu? Samo ovdje 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV od 199 USD u Nizozemskoj! Dell R420 - 2x E5-2430 2.2 Ghz 6C 128 GB DDR3 2x960 GB SSD 1 Gbps 100 TB - od 99 USD! Pročitaj o Kako izgraditi infrastrukturu corp. klase uz korištenje Dell R730xd E5-2650 v4 servera vrijednih 9000 eura za lipu?

Izvor: www.habr.com

Dodajte komentar