Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Dana 14. marta 2017, Arthur Khachuyan, izvršni direktor Social Data Hub-a, govorio je na BBDO predavanju. Arthur je govorio o inteligentnom praćenju, izgradnji modela ponašanja, prepoznavanju foto i video sadržaja, kao i drugim alatima i istraživanjima Social Data Hub koji vam omogućavaju da ciljate publiku koristeći društvene mreže i Big Data tehnologije.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Artur Khachuyan (u daljem tekstu - AH): - Zdravo! Zdravo svima! Moje ime je Arthur Khachuyan, vodim kompaniju Social Data Hub i bavimo se raznim interesantnim intelektualnim analizama otvorenih izvora podataka, informacionih polja i bavimo se raznim interesantnim istraživanjima i tako dalje.

A danas su nas kolege iz BBDO Grupe zamolile da razgovaramo o modernim tehnologijama za analizu velikih podataka, velikih i ne tako velikih podataka za oglašavanje: kako se to koristi, pokažite neke zanimljive primjere. Nadam se da ćete usput postavljati pitanja, jer mogu da dosadim i da ne otkrijem suštinu i tako dalje, pa nemojte da se stidite.

Zapravo, glavni pravci, gdje su se ikad koristila nekakva rješenja “skoro velikih podataka”, svi su jasni - to je ciljanje publike, analiza, provođenje neke vrste analitičkog marketinškog istraživanja. Ali uvijek je zanimljivo koji se dodatni podaci mogu pronaći, koja se dodatna značenja mogu pronaći nakon primjene analize.

Zašto nam je potrebna tehnologija za oglašavanje?

Gdje da počnemo? Najočiglednija stvar je oglašavanje na društvenim mrežama. Danas sam ga skinuo ujutro: iz nekog razloga VKontakte misli da bih trebao vidjeti ovu reklamu... Da li je dobra ili loša, drugo je pitanje. Vidimo da definitivno spadam u kategoriju vojnih obveznika:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Prva i najzanimljivija stvar koja se može uzeti kao tehnološko rešenje... Prvo što sam želeo da odlučim pre nego što počnemo jeste da definišemo pojmove: šta su otvoreni podaci, a šta veliki podaci? Jer svi ljudi imaju svoje shvatanje po ovom pitanju i ne želim nikome da namećem svoje uslove, ali... Samo da ne bude neslaganja.

Lično, mislim da su otvoreni podaci sve do čega mogu doći bez ikakve prijave ili lozinke. Ovo je otvoreni profil na društvenim mrežama, ovo su rezultati pretrage, ovo su otvoreni registri itd. Veliki podaci, po mom shvatanju, ja to vidim ovako: ako je tablica sa podacima, to je milijardu redova, ako je neka vrsta skladišta datoteka, to je negdje petabajt podataka. Ostalo u mojoj terminologiji nisu veliki podaci, već tako nešto.

Visoko precizno profilisanje i bodovanje profila

Idemo redom. Prva i najzanimljivija stvar do koje možete doći iz analize otvorenih izvora podataka je visoko precizno profiliranje i bodovanje profila. Šta je ovo? Ovo je priča u kojoj vaš nalog na društvenoj mreži može predvidjeti ne samo ko ste, ne samo vaša interesovanja.

Ali sada, kombinujući različite izvore, možete shvatiti prosječan nivo vaše plate, koliko košta vaš stan i gdje se nalazi. I svi ovi podaci se mogu koristiti doslovno iz dostupnih sredstava. Na primjer, ako uzmete svoj račun na društvenoj mreži, pogledajte, recimo, gdje živite, gdje radite; razumjeti u kojem dijelu poslovanja se nalazi kompanija u kojoj radite; preuzmite slične slobodna radna mjesta sa HH i “Superjob” ako ste analitičar, menadžer itd.; pogledajte gdje živite (baza, recimo CIAN), shvatite koliko košta iznajmljivanje kuće na ovom mjestu, koliko košta kupovina kuće na ovom mjestu, predvidite otprilike koliko zarađujete. Nadalje, koristeći svoje društvene mreže, možete razumjeti koliko putujete, gdje ste i koliko ste lojalni svom poslodavcu.

Shodno tome, od tako ogromnog broja metrika možemo učiniti sve što želimo. Možemo vas upoznati sa proizvodom koji vas zanima. Možete li zamisliti online prodavnicu? Odete tamo - ova internet prodavnica uhvati vaš nalog na društvenoj mreži i kaže vam: "Maša, upravo si raskinula sa svojim dečkom, evo nekih proizvoda za tebe." Ovo nije bliska buducnost...

Kako se određuje geografska lokacija osobe?

Odgovori na pitanja publike:

  • Obično se 80% svih prijava smatra tačnim mjestom boravka. Ali za ljude koji se nigde ne prijavljuju, postoji nekoliko opcija: ili prijava, ili geolokacija, ili je ovo analiza postova i publikacija za čitav vremenski period kada je neko nešto napisao... I negde, iskočiće nešto poput „Želim da kupim kolica u blizini Akademičeske“ ili „Nedavno sam ovde video ružne grafite na zidu“. Odnosno, za gotovo 80% ljudi njihova geolokacija, radno mjesto i mjesto stanovanja mogu se odrediti pomoću podataka ili metapodataka koji se mogu prikupiti sa društvenih mreža.

    Ovo je, opet, analiza postova. U najjednostavnijem smislu, ovo je analiza prijava i geolokacija na društvenim mrežama, koje ne brišu jpeg metapodatke (iz toga se nešto može zaključiti). Ali za preostale ljude to su obično tekstualni prijenosi: ili osoba "svijetli" svoju lokaciju kada piše o nečemu, ili "svijetli" svoj telefon, pomoću kojeg možete pronaći neke njegove reklame na Avitu ili njegovom računu na " Auto RU". Na osnovu ovih podataka možete kombinovati (na primjer, "Prodajem auto u blizini Mayakovskaya") i to otprilike pretpostaviti.

  • Ljudi to obično objavljuju na društvenim mrežama. Radimo samo s otvorenim izvorima i ovdje je riječ isključivo o otvorenim izvorima. Obično objavljuju oglase, odnosno u šezdeset posto slučajeva najčešća priča kada ljudi “pokažu” svoj trenutni broj mobitela su oglasi za prodaju nečega. Ili u nekim grupama osoba napiše („Prodajem ovo ili ono tamo“), ili ode negdje.

    Da! Obično komentarišu: „Odgovori mi ili pošalji SMS, nazovi moj broj. To se vrlo često dešava ljudima koji nešto prodaju, kupe na društvenim mrežama, komuniciraju sa nekim... Shodno tome, koristeći ovaj broj možete onda povezati njegov profil na CIAN-u na njega, ako je ikada nešto objavio, ili, opet, na Avito. Ovo su jednostavno najpopularniji, vrhunski izvori, biće i dalje - to su Avito, CIAN i tako dalje.

  • Ovo se odnosi na online prodavnicu. Sljedeća će biti tehnologija prepoznavanja lica i usklađivanja profila (pričat ćemo o tome). Čisto teoretski, ovo se može primijeniti na offline trgovinu. I generalno, moj veliki san je da kada se pojave ulični transparenti, kada prođete pored kamere, to vam “zarobi” lice. Ali ovaj slučaj će biti zabranjen zakonom jer se radi o povredi privatnosti. Nadam se da će se to dogoditi prije ili kasnije.
  • Iz ličnog iskustva. Vrlo često, kada vam neko nešto napiše, operišete se nekim činjenicama iz njegovog života koje kao da ne biste trebali znati... Ljudi se u većini slučajeva uplaše. Ali! Prema najnovijim statistikama, broj zatvorenih naloga na društvenim mrežama smanjen je za 14%. Povećava se broj lažnjaka, raste broj otvorenih računa - ljudi sve više idu ka otvorenosti. Mislim da će za 3-4 godine prestati tako oštro da reaguju na to da neko zna podatke o njima koje potencijalno ne bi trebalo da znaju. Ali to je zapravo vrlo lako dobiti gledajući njegov zid.

Šta se može preuzeti iz otvorenih izvora?

Postoji približna lista stvari koje se mogu razumjeti s prilično visokom pouzdanošću iz otvorenih izvora. U stvari, postoji još više različitih metrika; zavisi od korisnika takvog istraživanja. Postoji neka HR agencija koju zanima da li psujete na društvenim mrežama ili negdje u javnom prostoru. Nekoga zanima da li vam se sviđaju Navalnijeve publikacije ili, obrnuto, publikacije Ujedinjene Rusije, ili neka vrsta pornografskog sadržaja - takve stvari se događaju prilično često.

Glavne su porodične vrijednosti, približna cijena stana, kuće, potraga za automobilom i tako dalje. Na osnovu toga, ljudi se mogu podijeliti u društvene grupe. Ovo su korisnici Moscow Tindera, ko su (prema njihovim slikama koje se nalaze na njihovim Facebook nalozima); na osnovu svojih interesovanja dele se u različite društvene grupe:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ako se približimo oglašavanju, onda smo se polako udaljili od standardnog ciljanja oglašavanja, kada na VKontakteu odaberete da vas zanimaju 18-godišnjaci koji su pretplaćeni na određene grupe. Imam sledeću sliku, pokazaću ti sada:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Suština je da se većina trenutnih servisa koji analiziraju, u principu, ljudi koji analiziraju društvene mreže, bave analizom interesovanja... Prvo što ljudima padne na pamet je da analiziraju top grupe svojih pretplatnika. Možda ovo nekome odgovara, ali lično mislim da je to suštinski pogrešno. Zašto?

Vaši lajkovi se prikupljaju i analiziraju

Sada uzmite svoje telefone, pogledajte svoje top grupe - sigurno će biti više od 50% grupa na koje ste već zaboravili, ovo je neka vrsta sadržaja koji vam je zapravo nebitan. Uopšte ga ne konzumirate, ali će vas ipak sistem pratiti prema njima: da ste se pretplatili na recepte, na neke popularne grupe. Odnosno, prekršićete sistem koji analizira vaš profil, a vaši interesi neće biti opravdani.

Idemo dalje... Šta ima? Pretpostavljamo šta drugi ljudi rade. Po našem mišljenju, najadekvatniji način za procjenu interesa korisnika su lajkovi. Na primjer, na VKontakteu nema lajkova i ljudi misle da niko ne zna šta im se sviđa. Da, neki lajkovi se uvode na Instagramu, vidimo nešto na Facebooku, ali većina sadržaja u određenim grupama to ne emituje u zajedničkom feedu, a ljudi žive i misle da niko neće znati šta im se sviđa.

I prikupljanjem određenog sadržaja neke vrste koji nas zanima, prikupljanjem ovih postova, prikupljanjem ovih lajkova, zatim provjeravanjem ove osobe koristeći ovu bazu podataka, možemo sa velikom preciznošću utvrditi ko je on, kakva je njegova sudbina, šta ga zanima. Stavite ga tačno u određenu društvenu grupu i komunicirajte s njim.

Kupovina automobila menja ponašanje

Imam takav primjer. Odmah ću rezervirati da su moji primjeri gotovo reklamni i skoro marketinški, jer, znate, većina slučajeva je zaštićena NDA i tako dalje. Ali još će biti puno zanimljivih stvari. Dakle, priča sa ovim ljudima: to su muškarci koji su kupili automobil između 2010. i 2015. godine. Boja pokazuje kako se promijenilo njihovo društveno ponašanje na mreži. Promjenio se postotak djevojaka među pretplatnicima, pretplatila sam se na "dječačke" javne stranice, pronašla stalnog seksualnog partnera...

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Cijela ova stvar je raščlanjena po marki automobila i broju ljudi. Odavde možete izvući mnogo zanimljivih zaključaka o ponašanju ljudi i kako sve to funkcionira. Mogu reći da su Porsche Cayenne i zasađena Priora gotovo identični po broju privučene publike. Kvalitet ove publike i njihovo ponašanje su različiti, ali je kvantitet približno isti. Zaključak koji možete izvući odavde je šta god želite, bliže vašem tržištu. Ako prodajete Audi, pravite slogan "Kupite Audi i bježite od roditelja!" i tako dalje.

Da, ovo je smiješan primjer činjenice da ponašanje ljudi na osnovu analize lajkova, na osnovu toga u koju grupu prelaze, koji sadržaj analiziraju - sa skoro 100% vjerovatnoćom daje do znanja ko ste. Jer ako nemate pristup mrežnom saobraćaju i ne čitate lične poruke, lajkovi će vam uvijek reći ko je ta osoba - trudnica, majka, vojnik, policajac. A za vas, kao osobu koja se može oglašavati, ovo je veliki pogodak.

Odgovori na pitanja publike:

  • Svaka kolona je broj ljudi u ovom automobilu; kako su se njihovi obrasci ponašanja promijenili. Pogledajte: ljudi koji su kupili Porsche Cayenne - otprilike 550 ljudi (žuto), postotak djevojaka među pretplatnicima je povećan.
  • Uzorak su korisnici društvenih mreža „Vkontakte“, „Facebook“, „Instagram“ od 2010. do 2015. godine. Jedino pojašnjenje: ovdje odabrani automobili su oni koji se pomoću određenih alata mogu identificirati na fotografijama s više od 80% preciznosti.
  • U određenom vremenskom periodu njegov auto (pa, ne njegov, to ostavljamo društvenim mrežama)... U određenom vremenskom periodu osoba se stalno slikala sa autom, bila sa njim, piše u publikacijama. bile su različite, fotografije su bile iz različitih uglova i tako dalje. Zatim će biti slika koji se ljudi slikaju sa kojim automobilima i... Da, ovo je drugo pitanje - povjerenje u podatke društvenih mreža.
  • Pošto smo to spomenuli, nažalost, podaci društvenih mreža nisu uvijek tačni. Ljudi nisu uvijek skloni objavljivanju svojih informacija. Lično sam sproveo takvu studiju: uporedio sam broj diplomaca moskovskih univerziteta sa brojem ljudi registrovanih na društvenim mrežama. Na društvenim mrežama je u prosjeku registrovano 60% više ljudi - diplomaca Moskovskog državnog univerziteta za određenu godinu određenih specijalnosti nego što ih u principu ima. Dakle, da - tu je, naravno, postotak grešaka i niko to ne krije. Ovdje jednostavno uzimamo za osnovu one automobile koji se mogu identificirati sa više od 80% vjerovatnoće.

Lista izvora za obuku modela

Evo uzorka liste izvora koji se mogu koristiti, a koji se koristi da se sa velikom sigurnošću utvrdi društveni profil osobe, ko je ona.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Uzimamo profil sa društvenih mreža, od CIAN-a - cijena stana je otprilike, "Head-Hunter", "Superjob" - ovo je prosječna plata za datu osobu. Nadam se da ovdje nema predstavnika Head Huntera, jer smatraju da nije dobro uzimati ove podatke od njih. Međutim, to je prosječna plata u pojedinim regijama za određene vrste djelatnosti za slobodna radna mjesta.

“Avito”, “Avto.ru”: vrlo često ljudi, kada im je telefon upaljen, definitivno ga imaju (u velikom broju slučajeva) barem nešto na “Avito”, ili na “Avto.ru”, ili na još nekoliko stranica sa kojih možete razumjeti ko su oni. Da su kolica ili automobil prodata na ovom broju telefona... Rosstat i Jedinstveni državni registar pravnih lica su još više registara uz pomoć kojih možete rangirati kompaniju poslodavca - po nekoj formuli, po modelu koji bilo koja osoba može postaviti (možete otprilike odrediti novac te osobe itd.).

Tinder pomaže u prikupljanju podataka o situaciji ljudi

Osim toga, postoji tako zanimljiva stvar (alternativno, vrlo je smiješna u studiji) - ovo je, opet, prikupljanje podataka iz moskovskog Tindera pomoću botova za ovaj Tinder. Utvrđena je udaljenost do ljudi, a zatim je određena njihova približna lokacija.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Cilj ove studije bio je da se utvrdi broj Tinder naloga na teritoriji državnih institucija – u Dumi, tužilaštvu i tako dalje. Ali vi, kao oglašivač, možete zamisliti šta god želite: to može biti, na primjer, Starbucks ili neko drugi... Odnosno, broj ljudi na Tinderu koji piju kafu od vas, naručuju nešto, nalaze se u trgovinama Što se tiče ove geolokacije: to se može učiniti bilo kojom uslugom.

Odgovor na pitanje iz publike:

  • Tinder? Ne znaš? Tinder je aplikacija za upoznavanje u kojoj pregledavate fotografije (lijevo-desno), a ova aplikacija vam pokazuje udaljenost do osobe. Ako dobijete udaljenost do ove osobe s tri različite točke, možete otprilike (+ 5-7 metara) odrediti lokaciju. U ovom slučaju, za određivanje na teritoriji tužilaštva ili Državne dume, nije tako teško. Ali opet, to može biti vaša radnja, može biti bilo šta.

Na primjer, davno, davno smo imali jedan takav slučaj (a ne studiju), kada smo od jednog od mobilnih operatera dobili podatke o gustini saobraćaja, podatke o gustoći kretanja ćelijskih tačaka, a sve te informacije su naslagane. na koordinatama bilborda koji se nalaze na autoputevima. A zadatak mobilnog operatera je da otprilike odredi koliko ljudi prolazi i potencijalno bi moglo vidjeti ovu reklamu na bilbordu.

Ako ovdje postoje stručnjaci za reklamiranje na bilbordima, možete reći: nemoguće je razumjeti s superpouzdanošću - neko dolazi, neko nije pogledao, neko je pogledao... Ipak, ovo je primjer kako postoji 20 milijardi poligona ovi u Moskvi, na kojima je gustina tih ljudi na svakih sat vremena na određenim rutama... Vidite u svakom trenutku pored čega su ovi ljudi prolazili i otprilike procijenite protok putnika.

Odgovor na pitanje iz publike:

  • Takve podatke niko ne daje. Takvu smo studiju uradili za jednog od operatera, ovo je isključivo interna priča, tako da nažalost nije predstavljena u obliku slika. Ali često velike reklamne agencije nemaju problema da kontaktiraju operatera. Barem u Moskvi ima mnogo presedana kada se, na primjer, osiguravajuća društva obraćaju kompanijama poput GetTaxi, koje daju bezlične podatke o godinama vozača, o tome kako vozi (dobro - loše, nepromišljeno - ne), kako bi predvidjeli politike i tako dalje. Svi se bore s tim, ali na nekom internom nivou, davanje anonimnih podataka - mislim da niko nema takav problem.

Prepoznavanje slika i uzoraka

Nastavi. Moje omiljeno je prepoznavanje slika. Biće mali prilog o traženju ljudi po licima, ali mi uglavnom ne uzimamo ovaj deo. Uzimamo posebno prepoznavanje slike i određivanje šta je na ovoj slici - marka automobila, njegova boja itd.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Imam ovaj smiješan primjer:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Postojala je takva studija o traženju tetovaža na raznim društvenim mrežama. Shodno tome, isto se može primijeniti na bilo koju marku, na bilo koju vizualnu sliku, na gotovo svaku vizualnu sliku. Ima onih koji se ne mogu pouzdano utvrditi (mi ih ne uzimamo).

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Evo moje omiljene. Marke automobila prilično se često okreću ovom zadatku jer im je zadatak, na primjer, pronaći sve vlasnike nekog BMW-a X6, razumjeti ko su, kako su međusobno povezani, šta ih zanima i tako dalje. To se odnosi na pitanje sa kojim automobilima se ljudi slikaju na društvenim mrežama.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ovde uopšte nije bilo filtriranja: objekat je bio njihov, auto nije bio njihov; To je samo kvar automobila - starost i tako dalje. Ali vizualno prepoznavanje slike se koristi prilično često: to je potraga za trudnicama, i potraga za logotipom brenda u nekim masovnim medijima (ko šta objavljuje).

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Moj omiljeni slučaj (koji koriste razni restorani): kakve se kiflice objavljuju na društvenoj mreži. To je smiješna stvar, ali zapravo vam omogućava da shvatite mnogo zanimljivih stvari, prije svega, o vlastitim kupcima: ko je došao kod vas i zašto su to učinili. Jer nije tajna da se u suši barovima većina ljudi (neću reći "cure") slikaju kako bi se prijavili, fotografisali nešto itd.

Brend to može iskoristiti. Brend zanima kakve proizvode treba da lijepo fotografiše i postavi, kakvi su ljudi tamo došli. Ova stvar se može uraditi sa gotovo svime, od hrane.

Video prepoznavanje uzoraka

Odgovor na pitanje iz publike:

  • Ne na videu. Imamo ga u test modu. Isprobali smo ovu tehnologiju, ali se ispostavilo da... Poprilično dobro prepoznaje sve sa videom, ali nigdje nismo našli aplikaciju za nju. ćao. Osim što sam analizirao koliko i koji video blogeri negdje pričaju... Bila je takva studija. Koliko se njihovih lica sreće, koliko često. Ali brendovi još nisu shvatili gdje da smisle ovo. Možda će jednog dana doći.

Opet, ovo je hrana, mogu biti trudnice, muškarci (ne trudni), automobili - bilo šta.

Kao opcija, bila je novogodišnja studija za jedan medij. Također daleko od reklame, ali ipak. Evo kakvu su hranu ljudi postili za Novu godinu:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ovdje je također raščlanjeno po godinama. Vidi se takva korelacija da mladi uglavnom naručuju hranu, odrasli uglavnom prave tradicionalni sto. To je smiješna stvar, ali zamišljajući to kao vlasnika brenda, možete procijeniti veliki broj stvari: ko rukuje vašim proizvodom i kako, šta pišu o njemu. Često ljudi ne spominju uvijek samu marku u tekstu, a tradicionalni analitički sistemi praćenja ne mogu uvijek razumjeti i pronaći ovo spominjanje brenda samo zato što se ne spominje u tekstu. Ili je tekst pogrešno napisan, nema hash oznaka ili bilo čega.

Fotografije su vidljive. Kod fotografije možete reći da li je to središnji subjekt kadra ili nije središnji subjekt kadra. Onda možete vidjeti šta je ova osoba napisala. Ali najčešće se koristi kao potraga za potencijalnom publikom koja je vozila određene automobile i tako dalje. A onda ćemo uraditi mnogo zanimljivih stvari sa ovim automobilima.

Botovi su naučeni da imitiraju ljude

Postojala je i takva opcija za korištenje brojanja ljudi:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Postoji opcija za upoređivanje ljudi, kada trebate pronaći ljude koristeći neke fotografije, razumjeti njihov društveni profil, ko su oni. Opet se vraćamo na pitanje da ako imamo kameru u offline prodavnici, onda je ovo prilično dobar način da shvatite ko vam dolazi, ko su ti ljudi, šta ih zanima, šta ih je navelo da dođu kod vas .

Slijedi ono najzanimljivije: ako prikupimo njihove naloge na društvenim mrežama, shvatimo ko su ti ljudi, šta ih zanima, možemo (kao opciju) napraviti bota sličnog ovim ljudima; ovaj bot će početi živjeti kao ovi ljudi i analizirati koje reklame vidi na raznim društvenim mrežama. Ovo će vam omogućiti da tačno shvatite koji brendovi su ciljani na ovu osobu. Ovo je takođe prilično česta priča kada ne treba samo da analizirate ko je ta osoba i koje interese ima, već i na koju vrstu reklame bi trebalo da ciljaju vaši potencijalni konkurenti ili drugi zainteresovani.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Analiza veza na društvenim mrežama

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Sljedeća zanimljivost je analiza odnosa među ljudima. Zapravo, analiza veza u mreži, ovi mrežni grafovi - nema ni malo, ništa novo u tome, svi to znaju.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ali aplikacija za reklamne zadatke je najzanimljivija. Ovo je potraga za ljudima koji postavljaju trendove, ovo je potraga za ljudima koji šire informacije prema određenim kriterijumima unutar ove mreže. Recimo da nas zanimaju isti vlasnici određenog BMW modela. Ako ih sve okupimo, možemo pronaći one koji kontrolišu javno mnijenje. To nisu nužno blogeri o automobilizmu i tako dalje. Obično su to jednostavni drugovi koji sjede na raznim javnim stranicama, zanimaju ih neki sadržaji i mogu u vrlo kratkom roku privući vaš brend ili nekoga ko vas zanima u ovo područje odgovornosti, u područje ​kamatu.

Ovdje postoji takav primjer. Imamo neke potencijalne ljude, veze među ljudima. Ovdje narandžaste su ljudi, male tačke su zajedničke grupe, zajednički prijatelji.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ako sakupite sve te veze među njima, možete vrlo jasno vidjeti da postoje ljudi koji imaju veliki broj zajedničkih grupa, zajedničkih prijatelja, oni su tu među sobom... A ako se ova ista vizualizacija podijeli na grupe po interesima, po sadržaju, koji distribuiraju, koliko su u interakciji jedni sa drugima... Evo vidite da je prethodna slika postala ovakva:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ovdje se grupe jasno razlikuju po boji. U ovom slučaju radi se o našim studentima master studija na Višoj ekonomskoj školi. Ovdje možete vidjeti da su ljubičasti/plavi oni koji vole Transparency International, Otvorenu Rusiju i javne stranice Hodorkovskog. Dole levo su zeleni, oni koji vole Jedinstvenu Rusiju.

Vidite da je prethodna slika bila ovakva (ovo su samo veze među ljudima), ali je postala jasno razgraničena. Odnosno, svi ljudi su uvijek povezani jedni s drugima, imaju ista interesovanja, jedni s drugima su prijatelji. Jedni su na vrhu, drugi na dnu, a tamo još neki drugovi. A ako se svaki od ovih malih podgrafa posebno vizualizira sa ostalim parametrima i gleda na brzinu širenja sadržaja (grubo rečeno, ko šta tamo repostuje), u svakom dijelu možete pronaći jednu ili dvije osobe koje uvijek drže javno mnijenje u svojim rukama, u interakciji s kojima, tražeći da pošaljete neku vrstu posta ili nešto drugo - možete dobiti odgovor od cijele ove zanimljive publike.

Imam još jedan takav primjer. Također grafikon: ovo su zaposlenici BBDO Grupe pronađeni na društvenim mrežama kao primjer. Izgleda nezanimljivo, veliko, zeleno, veze među njima...

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ali imam opciju gdje su grupe već izgrađene između njih. Zatim, ako nekoga zanima, postoji interaktivna verzija - možete kliknuti i pogledati.

Gore desno su oni koji vole Putina. Ovdje su ljubičasti dizajneri; oni koje zanima dizajn, nešto zanimljivo i tako dalje. Ovdje su bijele stvari menadžerski tim (očigledno, koliko razumijem); To su ljudi koji, generalno, nisu ni na koji način povezani, ali rade na približno istim pozicijama. Ostalo su njihove zajedničke grupe, veze i tako dalje.

Brendovima nisu potrebni blogeri, već lideri mišljenja

Uzimamo te ljude i pronalazimo ih - onda reklamna agencija, reklamna kompanija sama odlučuje: može dati novac toj osobi da na neki način stupi u interakciju s tim sadržajem, nečim drugim, ili usmjeri svoju specifičnu reklamnu kampanju na njih. Ovo se takođe često koristi, pogotovo sada, jer svi brendovi žele da rade sa blogerima, žele da se njihov sadržaj promoviše, ali reklamne agencije baš i ne žele da kontaktiraju (pa, to se dešava).

A pravi izlaz iz ove situacije je pronaći ljude koji nisu blogeri, nisu beauty blogeri, već na primjer neka stvarna bića koja komuniciraju sa ovim brendom, koja mogu pisati na nekoj jadnoj javnoj stranici “Mail.ru Answers”, dobiti određeni broj pregleda. Ti ljudi, koji su stalno zainteresovani za sadržaj ove osobe, proširiće celu stvar, a brend će se uključiti.

Druga opcija za korištenje takve tehnologije sada je prilično relevantna - traženje botova, meni omiljeno. Ovo je reputacijski rizik za vaše konkurente, i prilika da izbacite nebitne ljude iz reklamne kampanje, i bilo čega drugog (brisanje komentara i traženje veza među ljudima). Imam takav primjer, također je velik i interaktivan - možete ga premjestiti. Ovo su veze ljudi koji su pisali komentare u zajednici Lentach.

Ovaj primjer je da shvatite koliko su botovi dobro i lako vidljivi; a za to vam nije potrebno nikakvo tehničko znanje. To znači da je “Lentach” objavio post o istrazi FBK-a o Dmitriju Medvedevu, a neki ljudi su počeli da pišu komentare. Sakupili smo sve ljude koji su pisali komentare - ti ljudi su zeleni. Sada ću ga premjestiti:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Ljudi su zeleni (koji su pisali komentare). Oni su ovde, oni su ovde. Plave tačke između njih su njihove zajedničke grupe, žute tačke su njihovi zajednički pretplatnici, prijatelji i tako dalje. Većina ljudi je međusobno povezana. Jer, kakva god da je teorija o tri, četiri, pet rukovanja, svi ljudi su međusobno povezani na društvenim mrežama. Ne postoje ljudi koji su odvojeni jedni od drugih. Čak i moji socijalno fobični prijatelji koji koriste VKontakte isključivo za gledanje videa i dalje su pretplaćeni na neke od istih javnih stranica kao i mi.

Navalny takođe koristi botove. Svi imaju botove

Većina ljudi (evo ga, evo) je međusobno povezana. Ali postoji tako mala grupa drugova koji se druže isključivo jedni s drugima. Evo ih, zelenih malih, evo njihovih zajedničkih prijatelja i grupa. Ovdje su čak odvojeno otpale:

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

I sretnim slučajem, upravo su ovi ljudi ispod ovog posta napisali: „Navaljni nema dokaza“ i tako dalje, napisali su iste komentare. Naravno, ne usuđujem se da donosim zaključke. Ali ipak, imao sam još jednu objavu na Fejsbuku, kada je bila debata između Lebedeva i Navaljnog, analizirao sam komentare na isti način: ispostavilo se da svi ljudi koji su napisali „Lebedev je sranje“, nisu bili na društvenim mrežama. mreže nedavno četiri mjeseca, nisu bile pretplaćene ni na jednu od javnih stranica, odjednom su otišle na ovu objavu, napisale upravo ovaj komentar i otišle. Opet, nemoguće je izvući zaključke odavde, ali mi je neko iz Navaljnog tima napisao komentar da ne koriste botove. Pa, ok!

Bliže oglašavanju, bliže brendu. Svi sada imaju botove! Imamo ih mi, imaju ih naši konkurenti, imaju ih i drugi. Moraju biti izbačeni ili ostavljeni da žive dobro; Na osnovu takvih podataka (pokazuje na prethodni slajd), dovedite ih do savršenstva da izgledaju kao stvarni ljudi i tek onda ih koristite. Iako je korištenje botova loše! Ipak, prilično uobičajena priča...

U automatskom načinu rada, takva stvar vam omogućava da iz vaše analize izbacite ljude koji su irelevantni za analizu, ljude koji ne bi trebali biti uključeni u uzorak, ne bi trebali biti uključeni u ovu studiju. Vrlo često se koristi. A opet, nemaju svi vlasnici automobila zapravo automobile. Ponekad ljude zanimaju samo ljudi koji potencijalno imaju auto, koji sjede u nekim grupama, komuniciraju s nekim, imaju tu određenu publiku.

Analiza činjenica i mišljenja

Sledeći koji imam je takođe moj omiljeni. Ovo je analiza činjenica i mišljenja.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Danas svi znaju kako da spomenu svoj brend u raznim izvorima. Nema tajne u tome. I izgleda da svi mogu da izračunaju tonalitet... Mada lično mislim da sama metrika tonaliteta nije baš interesantna, jer kad dođeš i kažeš klijentu "Čovječe, imaš 37% neutralnih" i on tako kaže , „Wow! Cool!" Stoga bi bilo zanimljivije otići malo dalje: od procjene osjećaja do procjene mišljenja onoga što oni govore o vašem proizvodu.

I ovo je također vrlo zanimljiva stvar, jer... Ja lično smatram da u principu ne može biti neutralnih poruka, jer ako čovjek nešto napiše u javnom prostoru, ta poruka je nekako obojena na bilo koji način. Ja lično nikada nisam vidio neutralnu poruku u kojoj se spominje brend. Obično je to neka vrsta prljavštine.

Ako uzmemo veliki broj ovih poruka (mogu biti milioni, 10 miliona), istaknemo glavnu ideju iz svake poruke, kombinujemo ih, možemo sasvim pouzdano shvatiti šta ljudi govore o ovom brendu, šta misle. „Ne sviđa mi se pakovanje“, „Ne sviđa mi se konzistencija“ i tako dalje.

Šta ljudi misle o Transaeru, Chupa Chupsu i predsjedniku Sjedinjenih Država?

Imam smiješan primjer: ovo je infografika o tome šta bi korisnici društvenih mreža radili s kompanijom Transaero nakon njenog bankrota.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Tamo ima mnogo zanimljivih primjera: spaliti, ubiti, deportirati u Evropu, čak 2% je napisalo - "Pošaljite ih u Siriju na vojne operacije." Prelazimo sa smiješne stvari, to može biti gotovo bilo koja marka - od moje omiljene hrane za pse do nekih automobila. Kome se ne sviđa ambalaža, ko ne voli prave stvari - uvijek možete raditi s ovim, uvijek možete uzeti u obzir. Veliki je broj primjera kada su ljudi umalo promijenili proizvodnju svojih proizvoda jer su na društvenim mrežama pisali da Chupa Chups nije dovoljno okrugao ili nije bio dovoljno sladak.

Postoji još jedan smiješan primjer. Pogodite koji komentari i o kome?

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Iz nekog razloga, sada se analiza mišljenja, analiza činjenica izvučenih iz poruka, ne koristi mnogo i nije mnogo rasprostranjena. Iako ova tehnologija nije supertajna, u tome praktički nema nikakvog know-howa, jer iz komentara ljudi izdvajanje subjekta, predikata i grupiranje ne zahtijeva genijalnost u kompjuterskoj lingvistici. To nije tako teško uraditi. Ali nadam se da će u narednih nekoliko godina ljudi početi koristiti ovo, jer... Biće super - ovo je tako automatska povratna informacija! Uvek znate šta govore o vama. Pa, razumete da je ovo napravljeno u vezi sa predsednikom SAD.

Odgovor na pitanje iz publike:

  • Da, ovo je Facebook na engleskom. Ovdje su prevedeni na ruski. Ovo je negde napisano.

Veliki podaci i političke tehnologije

Zapravo, imam mnogo različitih zanimljivih primjera politike o Trumpu i svima ostalima, ali odlučili smo da ih ne donosimo ovdje. Ali postoji jedan politički primjer.

Ovo su izbori za Državnu Dumu. kada ste bili? Prošle godine? Prije skoro godinu i po dana.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Evo ljudi koji su mogli da odrede svoju tačnu lokaciju, sve do određene geotačke, kako bi shvatili u koju izbornu jedinicu spadaju. I onda su od ovih ljudi uzimani samo oni koji su izrazili svoje određeno mišljenje, za koje bi glasali.

Sa stanovišta političke tehnologije, to nije baš korektno, jer cijelu ovu stvar treba normalizirati gustinom naseljenosti i tako dalje. Ipak, ovdašnji će plavi glasati za znate koga, crveni će glasati za opozicione drugove, kojih, inače, nije bilo mnogo.

Ja lično vjerujem da Big Data neće uskoro stići do političkih tehnologija, ali, kao opcija, kandidat je i brend. I ovo je donekle i analiza činjenica i mišljenja o vašem brendu, i prilično zanimljiva stvar, jer možete u realnom vremenu shvatiti ko šta radi. Znam nekoliko slučajeva sa BBC-ja, kada su u nekom prenosu pratili društvene mreže u realnom vremenu: bio je takav i takav odgovor, ljudi pišu o tome, postavljaju takva i takva pitanja - i super je! Mislim da će se vrlo brzo koristiti, jer je svima zanimljivo.

Modeliranje pozicija brenda

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Zatim imam modeliranje pozicija brenda. Mali, kratki članak o tome kako možete rangirati brendove koristeći različite metrike (ne sviđanja pretplatnika na društvenim mrežama, već koristeći složene metrike, interes za sadržaj, vrijeme provedeno na primanju metrika).

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Imam primjer "farma" iz određenog razloga. Ovdje su mali krugovi unutrašnji, svijetli - to je količina tekstualnog sadržaja koju sam brend kreira, veliki krug je količina foto i video sadržaja koju kreira sam brend.

Blizina centra pokazuje koliko je sadržaj zanimljiv publici. Postoji veliki model, ima gomila svakakvih parametara: lajkova, repostova, vremena odgovora, ko je tu u proseku delio... Evo vidite: ima divan „Kagotsel“, koji pumpa ogromnu količinu novac u kreiranje vlastitog sadržaja i zbog toga su prilično blizu centra. A ima i drugova koji također kreiraju svoj sadržaj, ali publiku to ne zanima. Ovo nije baš adekvatan primjer, jer su svi ovi računi praktično mrtvi.

Yegor Creed je voljen više od Baste

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Nažalost, ostalo... od čega da pokažem... Pa ima i ruskih repera, kao opcija, iz pravih kompanija.

Šta je plus? Činjenica je da kompanija u takav model može staviti gotovo sve, počevši od prosječne plate pretplatnika koji rade za vaš brend; bilo koji model koji im se sviđa. Budući da svaka reklamna agencija drugačije izračunava svoje metrike, brendovi drugačije izračunavaju svoje metrike.

Tu je i jedan - Basta, koji generiše veliku količinu sadržaja, ali se nalazi na periferiji, jer ovaj sadržaj očigledno nije baš zanimljiv publici. Opet, ne usuđujem se da sudim. Ali ipak, tu je Yegor Creed, koji je, prema društvenim mrežama, gotovo najbolji izvođač našeg vremena, ali objavljuje samo svoje lične fotografije. Ipak, on ima veliki broj pretplatnika: ima ih negdje oko milion. Ne sjećam se tačnog broja; Sećam se da je procenat angažovanosti ovih ljudi mnogo veći od 85%, odnosno na milion pretplatnika on dobije 850 hiljada odgovora od ovih stvarnih ljudi - ovo je pravo ludilo. Istina je.

Arthur Khachuyan: “Pravi veliki podaci u oglašavanju”

Odgovori na pitanja publike:

Koliko je vremena trebalo da se kreira model analize repera?

  • Svaka ima svoju ciljnu publiku, interesi ovih ljudi su kalkulisani za svakoga... Sve je to normalizovano na udaljenost do centra otprilike, njihov radijalni položaj nije bitan (jednostavno se namaže ovde radi lepote, pa da da ne naiđu jedno na drugo). Važna je samo približna blizina centra. Ovo je model koji koristimo. Na primjer, meni se više sviđa krug, neki to misle kao polukrug.
  • Ovaj model je sastavljen brzo, za dva-tri sata (da, jedna osoba). Ovdje su ubačene samo metrike: šta pomnožimo sa čime, saberemo i onda nekako normaliziramo. Zavisi od modela. Ima ljudi koje zanima prosječna plata (ovo nije šala) njihovih pretplatnika. A za ovo morate pronaći njihove kontakte, Avito, sve izračunati, pomnožiti. Dešava se da je potrebno mnogo vremena da se uzme u obzir, ali konkretno ovo (pokazuje na prethodni slajd) - parametri su ovdje vrlo jednostavni: pretplatnici, reposti i tako dalje. Bilo je potrebno oko dva do tri sata da se završi. Shodno tome, ova stvar se zatim ažurira u realnom vremenu i možete je koristiti.

Sada dolazi zabavni dio. Završio sam s primjerima, jer nije zanimljivo pričati dugo sam. I nadam se da ćete sada postavljati pitanja, a mi ćemo, zapravo, prelaziti s teme na temu, jer imam takve primjere kako se tehnologije mogu koristiti i tako dalje...

Odgovori na pitanja publike:

  • Imao sam jedan jedini lični slučaj sa jednim, da tako kažem, “blizu kazina”, kada je tu postavljena kamera, lica su se prepoznavala i tako dalje. Procenat ljudi koji se prepoznaju je svakako prilično velik - i naših i naših konkurenata. Ali zapravo je prilično zanimljivo. Vidim ovo kao zanimljivu stvar: možete razumjeti ko su ti ljudi i prilično dobro predvidjeti zašto su tačno došli ovdje, šta se toliko promijenilo u njihovim životima da su odlučili doći u kazino. Ali što se tiče određenih vrsta poslovanja... Ako tako nešto stavite u apoteku, onda nema smisla - ne možete predvidjeti zašto je osoba došla u apoteku.

    Globalni zadatak je bio da se izgradi model kako bi se shvatilo kada osoba potencijalno želi da se zainteresuje za vaš brend, tako da mu možete dati reklamiranje ne nakon što je nešto kupio (kao što se sada dešava), već mu dajte reklamu “ u prognozi” kada će se sve ovo dogoditi. Bilo je zanimljivo sa takvim „skoro-kazinom“; ispostavilo se da postoji prilično interesantan procenat ovih ljudi - zašto: neko je iznenada dobio unapređenje, neko drugi dobio nešto drugo - tako zanimljivi uvidi. Ali sa nekim radnjama, sa maloprodajom, sa trgovinom nekakvih tableta, čini mi se da neće biti baš korektno.

Da li se veliki podaci koriste van mreže?

  • Bilo je van mreže. Samo trebate tačno shvatiti, otprilike, da li će ovaj model odgovarati ili ne. Opet sa gaziranom vodom... Mene zapravo sve zanima, ali meni lično nije jasno koliko, kako profili ovih ljudi, njihovo ponašanje mogu da zavise od toga kada žele da kupe flaširanu vodu. Iako je ovo možda zaista istina, ne znam.

Koliko ima otvorenih naloga na društvenim mrežama?

  • Konkretno imamo 11 društvenih mreža - to su “Vkontakte”, “Facebook”, “Twitter”, “Odnoklassniki”, “Instagram” i neke sitnice (mogu pogledati listu, poput “Mail.ru” i tako dalje) . Definitivno imamo kopiju svih ovih drugova na VKontakteu. Imamo ljude na VKontakteu - to je 430 miliona svih koji su ikada postojali (od kojih je oko 200 miliona stalno aktivno); postoje grupe, postoje veze između tih ljudi i postoji sadržaj koji nas zanima (tekst), i dio medija, ali vrlo mali... Grubo rečeno, gledamo ovu sliku: ako tamo ima lica, mi spasimo ih, ako postoji mem, mi ih sačuvamo Ne čuvamo ga, jer ni mi ne bismo imali dovoljno da sačuvamo medijski sadržaj.

    Postoji Facebook na ruskom jeziku. Negde sada 60-80% su Odnoklassniki, za par meseci ćemo ih verovatno sve izvući do kraja. Ruski Instagram. Za sve ove društvene mreže postoje grupe, ljudi, veze između njih i tekst.

  • Oko 400 miliona ljudi. Postoji suptilnost: postoje ljudi čiji grad nije naveden (potencijalno su Rusi / neRusi); Od toga je prosjek za društvene mreže 14% zatvorenih naloga na VKontakteu, ne znam tačan broj na Facebooku.
  • Takođe ne čuvamo medije na Instagramu - samo ako tamo ima lica. Takve (druge) medijske sadržaje ne pohranjujemo. Obično zanimljivo: samo tekst, veze među ljudima; Sve. Najčešće istraživanje na Instagramu je uobičajeno istraživanje publike: ko su ti ljudi i, što je najvažnije, povezanost tih ljudi sa drugim društvenim mrežama. Pronađite profil ove osobe na Vkontakteu i Facebooku kako biste izračunali njegovu starost i tako dalje.
  • Još uvijek nema potrebe preuzimati sve ostale - jednostavno zato što nema kupaca. Što se tiče jezika: imamo ruski, engleski, španski, ali se i dalje koristi isključivo za brendove iz Rusije; pa ili kompanije koje ih dovoze iz Rusije.
  • Intervjuiramo ljude svaki dan u mnogo, mnogo, mnogo tema: prikupljamo podatke prikupljanjem weba i ažuriramo ove indikatore koristeći Api. Za 2-3 dana možete proći kroz cijeli "VKontakte", prolazeći kroz njih; Za otprilike nedelju dana možete proći kroz ceo Facebook, shvatiti ko je šta ažurirao, a šta nije. I onda ponovo sastavite ove ljude posebno: šta se tačno promenilo, zapišite celu ovu priču. Po mom iskustvu, vrlo rijetko je nečiji stari profil na društvenim mrežama korišten u bilo kakve stvarne poslovne svrhe. To je bilo vrijeme kada se jedna politička ličnost prijavila, a njegov zadatak je bio da shvati kakvi ljudi dolaze u centralu, ko su ti ljudi prije 6-8 mjeseci (jesu li obrisali svoj profil, a zapravo za drugog kandidata stizali su listići razmaziti).

    I par puta - lične priče kada su nečije fotografije objavljene u javnom domenu. Trebalo je pronaći veze itd. Nažalost, šteta, ali ne možemo svjedočiti na sudu, jer je naša baza podataka pravno nelikvidna.

  • MongoDB skladište mi je omiljeno.

Društvene mreže pokušavaju se boriti protiv prikupljanja podataka

  • Obično postavljamo samo listu ovih naloga oglašivačima, a onda oni koriste standardni... To jest, na društvenim mrežama, na VKontakteu, možete odrediti listu tih ljudi.

    Ali Facebook koristi kupljene kolačiće. Mi sami ne radimo s kolačićima, ali bilo je nekoliko priča kada je oglašivač sam dao nekim ljudima, mi smo komunicirali s njima - oni imaju te mreže, sa teaser, non-teaser oglašavanjem, te "kolačiće". Možete ga vezati - nema sumnje! Ali ne volim ove stvari jer ne mislim da su baš autentične. Ovo je čisto po mom mišljenju, to je kao TNS koji "prati" televizore - nije jasno da li gledate ovaj TV ili ne, da li perete suđe dok vam je TV uključen... I ovde je isto : Vrlo često guglam nešto na internetu, ali to ne znači da želim to kupiti.

  • Ako koristite neku vrstu standardne mreže kontekstualnog oglašavanja: Imao sam nekoliko priča kada smo im istovarili te ljude i pokušali, koristeći njihova sučelja, da ih povežemo s „kolačićima“ na njihovim stranicama. Ali ja ne volim takve stvari.

Formula za obračun plate korisnika interneta

  • Opšta formula za prosječnu platu: ovo je regija u kojoj osoba živi, ​​ovo je kategorija poslovanja u kojoj radi (tj. kompanija koja mu je poslodavac), zatim se uzima njegova pozicija u ovoj kompaniji, prosjek plata za ovu poziciju je procijenjena... Prosječna plata preuzeta iz “Head Hunter” i “Superjob” (i postoji nekoliko drugih izvora) za dato radno mjesto u datom regionu i za dati poslovni kontekst.

    Od “Avito” i “Avto.ru” se obično uzimaju dodatni parametri ako je osoba osvijetlila telefon. Uz Avito možete vidjeti kakve stvari čovjek prodaje - skupe, jeftine, korištene, nekorišćene. Sa "Avto.ru" možete vidjeti da li ima auto - on ga posjeduje, on ga ne posjeduje. To je negdje manje od 20% ljudi koji su negdje slučajno ispustili telefon, a njihov račun se može povezati s tim podacima.

Kojim količinama posluje kompanija za prikupljanje podataka?

  • Količina pohranjenih fotografija u petabajtima je 6,4. Ne mogu sada tačno reći koliki je rast, jer smo 2016. počeli snimati “periskope” i tek počeli snimati video.

    Ne mogu tačno reći kada je bila nula. Selili smo se iz kompanije u kompaniju - sve su to duge priče. Ali mogu reći da VK, Facebook, Instagram i Twitter – sav ovaj posao (ljudi, grupe i veze između njih) sa tekstom i sadržajem – to zapravo nije puno podataka, teško da je i petabajt dovoljno. Mislim da je 700 gigabajta, vjerovatno 800.

Pomažete li klijentima da odrede trenutnu nišu i gdje da kopaju?

  • Kada klijent dođe, mi mu takve stvari predlažemo, ali mi sami, kao Google Trends, ne radimo takve stvari.
  • Imali smo nekoliko skoro socioloških priča, sa izbornom, predizbornom istorijom - sve smo to analizirali. Uz brendove i procjenu mišljenja o brendovima, gotovo uvijek se sve slaže. Evo izborno-izbornih priča - ne (sa procjenom koji kandidat treba da pobijedi). Ne znam ko tu nije u pravu - mi ili oni koji razmišljaju u VTsIOM-u.
  • Obično ove kontrolne rezultate uzimamo od samog brenda, oni ih uzimaju od drugova koji naručuju istraživanje – telefonsko istraživanje, istraživanje marketinga itd. Plus, cijela ova stvar se može provjeriti osnovnim stvarima: neko se javio na mailing listu, neko je radio ankete... Ako se radi o velikom brendu (Coca-Cola, na primjer), sigurno imaju milion-dva internih recenzija kupaca. – to nisu samo komentari na društvenim mrežama i neka mišljenja; To su nekakvi interni sistemi, pregledi i tako dalje.

Zakon ne „zna“ šta su lični podaci!

  • Analiziramo isključivo otvorene izvore podataka i nikada se ne upuštamo u prljave trikove. Naš model je izgrađen na činjenici da sve otvorene podatke pohranjujemo u neke javne centre podataka, iznajmljujemo ih negdje drugdje i analiziramo kod kuće, u našim uredima, na našim serverima i ne odlaze nigdje van teritorije.

    Ali naše zakonodavstvo u oblasti otvorenih podataka je vrlo nejasno.

    Nemamo jasno razumijevanje šta su otvoreni podaci, šta su lični podaci - postoji ovaj 152. savezni zakon, ali ipak... Kako se oni računaju? Sada, ako imam vaše ime i vaš broj telefona u jednoj bazi podataka, u drugoj bazi podataka imam vaš broj telefona i vaš e-mail, u trećoj imam, recimo, vaš e-mail i vaš auto; Čini se da su sve ovo nelični podaci. Ako sve ovo spojite, čini se da će po zakonu to postati lični podaci.

    Ovo zaobilazimo na dva načina. Prvi je da se instalira server sa softverom za klijenta, a onda ti podaci ne izlaze van njegove teritorije, a zatim je klijent odgovoran za distribuciju tih ličnih podataka, neličnih podataka i tako dalje. Ili druga opcija: ako je ovo neka priča u kojoj morate tužiti društvenu mrežu ili nešto drugo...

    Imali smo takvu studiju kada smo za Lifenews prikupili (bile su predizbori Jedinstvene Rusije) račune ovih drugova i pogledali kakvu pornografiju vole. Bila je to smiješna stvar, ali ipak. Ovo prodajemo kao svoje, lično mišljenje, a da u dokumentima zakonski ne otkrivamo šta smo analizirali – Jedinstveni državni registar pravnih lica, plate, društvene mreže; Prodamo stručno mišljenje, a onda na marginama objašnjavamo osobi šta smo i kako analizirali.
    Bilo je nekoliko priča, ali su se odnosile na neke javne komercijalne projekte. Na primjer, imamo besplatni neprofitni projekt za one koji voze longboarde (takve daske su dugačke): zadatak je bio prikupiti publikacije ljudi - kada neko objavi "Išao sam u park Gorki da se provozam." A sada bi trebalo da se nađe na mapi, i ljudi oko njega mogu da vide da je neko u njegovoj blizini. VK se jako dugo hvatao za glavu na ovu temu, jer im se nije svidjelo što objavljujemo ove informacije bez dopuštenja ljudi. Ali onda stvar nije došla na sud, jer smo unutar nekoliko velikih zajednica dodali u pravila da podatke mogu koristiti treće strane, agencije, kompanije, analize itd. Naravno, nije bilo posebno etično, ali ipak.

  • Upravo smo to shvatili na vrijeme i počeli svima prodavati svoje stručno mišljenje.

Da li radite sa obrazovnim institucijama?

  • Sarađujemo sa obrazovnim institucijama, da. Imamo čitav niz: imamo master program na Višoj školi, a sarađujemo i sa drugim univerzitetima. Mnogo volimo univerzitete!
  • Ako imate moje kontakte, možete mi pisati. I link do prezentacije, ako nekoga zanima - svi ovi primjeri su tu, možete premjestiti.
  • Ako znate broj telefona, mail - ovo je skoro stopostotna opcija, niko je neće ukloniti. Ako nema telefonskog broja, obično je slika, ako nema, to je godina, mjesto stanovanja, posao. Odnosno, po godinama, mjestu stanovanja i rada, gotovo svako se može prilično suptilno identificirati. Ali ovo je, opet, pitanje zadatka.

    Imamo, recimo, klijenta koji prodaje internet televiziju. Neko je od njih kupio pretplatu na ove “Igre prijestolja”, a zadatak je da pomoću CRM-a pronađe te ljude na društvenim mrežama, a zatim pronađe one potencijalne iz njihovog područja utjecaja. Mislim samo da imaju, recimo, ime, prezime i e-mail... I onda je jako teško bilo šta uraditi. U većini slučajeva ljudi se mogu pronaći putem e-pošte.

  • Na osnovu sastava naših prijatelja obično „spojimo“ ljude na društvenim mrežama, ali to nije uvijek tačno. Nije da nije uvijek ispravno – ne funkcionira uvijek. Prvo, to zahtijeva mnogo truda, jer će se ova operacija (uparivanje ljudi) prvo morati izvesti za svakog od prijatelja - da bi shvatili jesu li došli sa društvenih mreža ili ne. I onda - nikome nepoznata činjenica da na VKontakteu imamo iste prijatelje, na Facebooku imamo različite prijatelje. Ne za svakoga, ali za mene je, na primjer, ovako; a to važi i za većinu ljudi.

Kako se prikupljaju najpotpuniji podaci?

  • Instaliranje softvera za klijenta na njegovoj strani. Na njima je instaliran server koji od nas preuzima samo javne podatke, a njihove lične podatke obrađuje interno. Sa klijentom se zaključuje NDA. Ovo, naravno, nije baš tačno da nam to prenose, ali pravnu odgovornost snosi klijent – ​​pa, odnosno instaliranje softvera za njega, ili prenošenje anonimnih podataka. Ali to je bilo vrlo rijetko, jer - ispravna ili netačna anonimizacija - u većini slučajeva se gubi ovisnost između ovih ljudi.

Ko kupuje softver za prepoznavanje lica?

  • Mi zapravo idemo ovdje jer naš glavni softver koji prodajemo je pretraživanje lica, analiza korelacije i prodajemo ga vladinim agencijama. A prije godinu i po odlučili smo da sve te priče stavimo u oglašavanje, u marketing, na javno tržište - tako je nastao Social Data Hub, komercijalno pravno lice. A sada upravo dolazimo ovamo. Družimo se ovde već godinu i po, pokušavajući da objasnimo ljudima da nema potrebe da se ljudima daju downloadi uz pominjanje, da im treba dati odgovore na pitanja, da nema potrebe za tonalitetom , i tako dalje. Tako da je teško reći gde...
  • (Na koga misliš?) Svim drugovima koji treba da traže teroriste i pedofile.
    Odmah mogu reći (to će biti sljedeće pitanje): prema našim podacima nijedan nastavnik nije zatvoren zbog repostiranja.
  • Na VKontakteu - 14%; na ​​Facebooku nema zatvorenog profila kao takvog (postoji zatvorena lista prijatelja i tako dalje). A najzanimljivije je da sam upravo napisao poruku - sad će prebrojati i reći.

Ne objavljujte nešto čega ćete se stidjeti!

  • Ne objavljujte na društvenim mrežama ništa zbog čega bi vas bilo sramota – ja lično ovo pratim. Iako sam imao dosta ličnih, jer se kunem na fejsu. Pa, bilo je i moralo se nešto uraditi... Nemojte objavljivati ​​ništa što bi bilo sramotno! Ako ćete kasnije raditi negdje u Javnoj komori, da, bolje je da ne komentarišete. Ako to nećete učiniti, uveliko, nikoga nije briga. Mogu samo da vas uverim da niko ne čita vašu ličnu prepisku, a sve ovo gradi celu ovu priču...

    Svake sedmice mi neko definitivno dođe i kaže: „Pa, fotografije mog prijatelja su procurile na neku anonimnu javnu stranicu! Upomoć! Usput, nikada ništa ne objavljujte na anonimnim javnim stranicama.

  • Ne znam za druge sisteme praćenja - ovo ćemo svakako uzeti u obzir, da je pominjanje brenda bilo negativno, bože mi oprosti... Ali mogu reći da svakakve drugove blizu države zanimaju samo ljudi koji imaju više od 5 hiljada publike, a njihovo javno mnjenje može uticati na nekoga. Po mom iskustvu, nikada se nije dogodilo da HR agencija koja od nas naručuje procjenu profila kaže: „Ko voli Navalnog, ne zapošljavajte nikoga!“

O objavljivanju rezultata. Koliko je ljudi zaposleno u istraživanju?

  • Od 10 najboljih reklamnih kompanija, sedam ih sada objavljuje. Teško je reći: kada smo to počeli prije godinu i po dana... Imamo nekoliko ljudi u svakoj oblasti - ima nekoliko ljudi u bankama, ima nekoliko ljudi u HR, ima nekoliko ljudi u oglašavanju. I sad razmišljamo kome je isplativije prije otići, za koga trebamo početi praviti neke interfejse...
  • (otprilike broj ljudi po segmentu tržišta) Ne više od 25 ljudi, jer nikoga nismo silovali.
  • Generalno, u principu, ove tehnologije sa tržišta se koriste, mislim, više od 50%. Neki u reklamnim kampanjama, neki u nekakvoj internoj analitici. Rekao bih da ga 40 posto koristi u internoj analitici, 50-60% ga prodaje krajnjim brendovima. Ali to već zavisi od samih reklamnih kompanija. Vidite, neki se prijavljuju jednostavno za potrošen novac, reklamu koju su postavili, dok drugi pišu koliko su ljudi doveli, kakvu publiku... Rekao bih, ali možda grešim - ne Zaista ne mogu zamisliti kako svi ovi drugovi rade. Znam samo u kvantitativnim podacima.

Neke reklame 🙂

Hvala vam što ste ostali s nama. Da li vam se sviđaju naši članci? Želite li vidjeti još zanimljivih sadržaja? Podržite nas naručivanjem ili preporukom prijateljima, cloud VPS za programere od 4.99 USD, jedinstveni analog servera početnog nivoa, koji smo mi izmislili za vas: Cijela istina o VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps od 19$ ili kako dijeliti server? (dostupno sa RAID1 i RAID10, do 24 jezgra i do 40GB DDR4).

Dell R730xd 2 puta jeftiniji u Equinix Tier IV data centru u Amsterdamu? Samo ovdje 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV od 199 USD u Holandiji! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - od 99 USD! Pročitajte o Kako izgraditi infrastrukturnu kompaniju. klase uz korišćenje Dell R730xd E5-2650 v4 servera u vrednosti od 9000 evra za peni?

izvor: www.habr.com

Dodajte komentar