Den 14 mars 2017 talade Arthur Khachuyan, VD för Social Data Hub, vid BBDO-förelÀsningen. Arthur talade om intelligent övervakning, att bygga beteendemodeller, kÀnna igen foto- och videoinnehÄll, sÄvÀl som andra Social Data Hub-verktyg och forskning som lÄter dig rikta in dig pÄ mÄlgrupper med hjÀlp av sociala nÀtverk och Big Data-teknik.
Arthur Khachuyan (nedan â AH): - HallĂ„! Hej alla! Jag heter Arthur Khachuyan, jag driver företaget Social Data Hub och vi hĂ„ller pĂ„ med olika intressanta intellektuella analyser av öppna datakĂ€llor, informationsfĂ€lt och gör alla möjliga intressanta undersökningar och sĂ„ vidare.
Och idag bad kollegor frÄn BBDO Group oss att prata om modern teknik för att analysera stor data, stor och inte sÄ stor data för reklam: hur den anvÀnds, visa nÄgra intressanta exempel. Jag hoppas att du stÀller frÄgor pÄ vÀgen, för jag kan bli trÄkig och inte avslöja essensen och sÄ vidare, sÄ var inte blyg.
I sjÀlva verket Àr de huvudsakliga riktningarna, dÀr nÄgon form av "nÀra-big-data"-lösningar anvÀndes, alla tydliga - det hÀr Àr mÄlgruppsinriktning, analys, att utföra nÄgon form av analytisk marknadsundersökning. Men det Àr alltid intressant vilka ytterligare data som kan hittas, vilka ytterligare betydelser som kan hittas efter att ha tillÀmpat analysen.
Varför behöver vi teknik för reklam?
Var börjar vi? Det mest uppenbara Àr reklam pÄ sociala nÀtverk. Idag tog jag av den pÄ morgonen: av nÄgon anledning tycker VKontakte att jag borde se just den hÀr annonsen... Om den Àr bra eller dÄlig Àr den andra frÄgan. Vi ser att jag definitivt faller inom kategorin vÀrnpliktiga:
Det allra första och mest intressanta som kan tas som en teknisk lösning... Det första jag ville bestÀmma mig för innan vi börjar Àr att definiera termerna: vad Àr öppen data och vad Àr big data? Eftersom alla mÀnniskor har sin egen förstÄelse i denna frÄga, och jag vill inte pÄtvinga nÄgon mina villkor, men... Bara sÄ att det inte finns nÄgra avvikelser.
Personligen tror jag att öppen data Àr allt jag kan nÄ utan inloggning eller lösenord. Det hÀr Àr en öppen profil pÄ sociala nÀtverk, det hÀr Àr sökresultat, det hÀr Àr öppna register etc. Big data, enligt min egen förstÄelse, ser jag det sÄ hÀr: om det Àr en dataskylt Àr det en miljard rader, om det Àr nÄgon sorts av fillagring, Àr det nÄgonstans en petabyte data. Resten i min terminologi Àr inte big data, utan nÄgot sÄdant.
Högprecisionsprofilering och profilpoÀngning
LÄt oss gÄ i ordning. Det allra första och mest intressanta du kan komma pÄ genom att analysera öppna datakÀllor Àr högprecisionsprofilering och profilpoÀng. Vad Àr detta? Det hÀr Àr en historia dÀr ditt sociala nÀtverkskonto inte bara kan förutsÀga vem du Àr, inte bara dina intressen.
Men nu kan du, genom att kombinera olika kÀllor, förstÄ den genomsnittliga lönenivÄn, hur mycket din lÀgenhet kostar och var den ligger. Och all denna data kan bokstavligen anvÀndas frÄn tillgÀngliga medel. Till exempel, om du tar ditt konto pÄ ett socialt nÀtverk, titta, sÀg, var du bor, var du arbetar; förstÄ vilken del av verksamheten företaget du arbetar för Àr i; ladda ner liknande lediga tjÀnster frÄn HH och "Superjob" om du Àr analytiker, chef, etc.; titta pÄ var du bor (bas, sÀg CIAN), förstÄ hur mycket det kostar att hyra ett hem pÄ det hÀr stÀllet, hur mycket det kostar att köpa ett hem pÄ det hÀr stÀllet, förutsÀg ungefÀr hur mycket du tjÀnar. Med hjÀlp av dina sociala nÀtverk kan du dessutom förstÄ hur mycket du reser, var du Àr och hur lojal du Àr mot din arbetsgivare.
Följaktligen, frÄn ett sÄ stort antal mÀtvÀrden kan vi göra vad vi vill. Vi kan presentera dig för en produkt som intresserar dig. Kan du tÀnka dig en webbutik? Du gÄr dit - den hÀr onlinebutiken fÄngar ditt konto pÄ ett socialt nÀtverk och sÀger till dig: "Masha, du har precis gjort slut med din pojkvÀn, hÀr Àr nÄgra vissa produkter för dig." Det hÀr Àr inte den nÀrmaste framtiden...
Hur bestÀms en persons geolokalisering?
Svar pÄ frÄgor frÄn publiken:
- Vanligtvis anses 80 % av alla incheckningar vara den exakta bostadsorten. Men för mÀnniskor som inte checkar in nÄgonstans finns det flera alternativ: antingen incheckning eller geolokalisering, eller sÄ Àr det hÀr en analys av inlÀgg och publikationer för hela den tidsperiod dÄ en person skrev nÄgot... Och nÄgonstans, nÄgot kommer att dyka upp som "Jag vill köpa en barnvagn nÀra Akademicheskaya" eller "Jag sÄg nyligen ful graffiti pÄ vÀggen hÀr." Det vill sÀga, för nÀstan 80 % av mÀnniskorna kan deras geolokalisering, deras arbetsplats och deras vistelseort bestÀmmas med hjÀlp av data eller metadata som kan samlas in frÄn sociala nÀtverk.
Detta Àr Äterigen en analys av inlÀgg. I den enklaste meningen Àr detta en analys av incheckningar och geolokaliseringar i sociala nÀtverk, som inte raderar jpeg-metadata (du kan rÀkna ut nÄgot frÄn det). Men för de ÄterstÄende personerna Àr dessa vanligtvis textsÀndningar: antingen "lyser" en person sin plats nÀr han skriver om nÄgot, eller sÄ "lyser" han sin telefon, med vilken du kan hitta en del av hans reklam pÄ Avito eller hans konto pÄ " Auto RU". Baserat pÄ dessa uppgifter kan du kombinera (till exempel "Jag sÀljer en bil nÀra Mayakovskaya") och ungefÀr anta detta.
- Folk brukar posta detta pÄ sociala medier. Vi arbetar bara med öppna kÀllor och hÀr pratar vi uteslutande om öppna kÀllor. De brukar publicera annonser, det vill sÀga i sextio procent av fallen Àr den vanligaste historien nÀr folk "visar" sitt nuvarande mobilnummer annonser för försÀljning av nÄgot. Antingen i vissa grupper skriver en person ("Jag sÀljer det eller det dÀr") eller gÄr nÄgonstans.
Ja! De brukar kommentera som: "Svara mig eller skicka ett sms, ring mitt nummer. Detta hÀnder vÀldigt ofta för personer som sÀljer nÄgot, köper nÄgot pÄ sociala nÀtverk, kommunicerar med nÄgon... Följaktligen, med hjÀlp av detta nummer kan du sedan lÀnka hans profil pÄ CIAN till det, om han nÄgonsin har publicerat nÄgot, eller, igen, pÄ Avito. Dessa Àr helt enkelt de mest populÀra toppkÀllorna, det kommer att finnas lÀngre fram - dessa Àr Avito, CIAN och sÄ vidare.
- Detta avser en webbutik. NÀsta kommer att vara tekniken för ansiktsigenkÀnning och profilmatchning (vi kommer att prata om det). Rent teoretiskt kan detta appliceras pÄ en offlinebutik. Och generellt sett Àr min stora dröm att nÀr gatubanderoller dyker upp, nÀr du gÄr förbi en kamera, "fÄngar" det ditt ansikte. Men det hÀr fallet kommer att förbjudas enligt lag eftersom det Àr en krÀnkning av integriteten. Jag hoppas att det kommer att hÀnda förr eller senare.
- Av personlig erfarenhet. Mycket ofta, nĂ€r en person skriver nĂ„got till dig, opererar du pĂ„ nĂ„gra fakta frĂ„n hans liv som du inte borde kĂ€nna till... MĂ€nniskor blir i de flesta fall rĂ€dda. Men! Baserat pĂ„ fĂ€rsk statistik har antalet stĂ€ngda konton pĂ„ sociala nĂ€tverk minskat med 14 %. Antalet förfalskningar ökar, antalet öppna konton vĂ€xer â mĂ€nniskor gĂ„r allt mer mot öppenhet. Jag tror att de om 3-4 Ă„r kommer sluta reagera sĂ„ starkt pĂ„ att nĂ„gon kĂ€nner till information om dem som de potentiellt inte borde veta. Men det Ă€r faktiskt vĂ€ldigt lĂ€tt att fĂ„ till genom att titta pĂ„ hans vĂ€gg.
Vad kan hÀmtas frÄn öppna kÀllor?
Det finns en ungefÀrlig lista över saker som kan förstÄs med ganska hög tillförlitlighet frÄn öppna kÀllor. Faktum Àr att det finns Ànnu fler olika mÄtt; det beror pÄ kunden av sÄdan forskning. Det finns nÄgon HR-byrÄ som Àr intresserad av om du svÀr pÄ sociala nÀtverk eller nÄgonstans i det offentliga rummet. NÄgon Àr intresserad av om du gillar Navalnyjs publikationer eller omvÀnt United Russia-publikationer eller nÄgon form av pornografiskt innehÄll - sÄdana saker hÀnder ganska ofta.
De viktigaste Àr familjevÀrden, den ungefÀrliga kostnaden för en lÀgenhet, ett hem, att leta efter en bil och sÄ vidare. UtifrÄn detta kan mÀnniskor delas in i sociala grupper. Dessa Àr Moscow Tinder-anvÀndare, vilka de Àr (enligt deras bilder som finns pÄ deras Facebook-konton); baserat pÄ sina intressen Àr de indelade i olika sociala grupper:
Om vi ââgĂ„r nĂ€rmare reklam sĂ„ har vi sakta gĂ„tt bort frĂ„n standard reklaminriktning, nĂ€r du vĂ€ljer pĂ„ VKontakte att du Ă€r intresserad av 18-Ă„riga mĂ€n som prenumererar pĂ„ vissa grupper. Jag har den hĂ€r bilden hĂ€rnĂ€st, jag ska visa dig nu:
Summan av kardemumman Àr att de flesta av de nuvarande tjÀnsterna som i princip analyserar mÀnniskor som analyserar sociala nÀtverk, Àr engagerade i att analysera intressen... Det första som kommer till folks sinnen Àr att analysera toppgrupperna för sina prenumeranter. Kanske fungerar detta för vissa, men personligen tycker jag att det Àr fundamentalt fel. Varför?
Dina likes samlas in och analyseras
Ta nu dina telefoner, titta pĂ„ dina toppgrupper â det kommer definitivt att finnas mer Ă€n 50 % av grupperna som du redan har glömt bort, det hĂ€r Ă€r nĂ„gon form av innehĂ„ll som faktiskt Ă€r irrelevant för dig. Du konsumerar det inte alls, men Ă€ndĂ„ kommer systemet att spĂ„ra dig enligt dem: att du har prenumererat pĂ„ recept, pĂ„ nĂ„gra populĂ€ra grupper. Det vill sĂ€ga, du kommer att bryta mot systemet som analyserar din profil, och dina intressen kommer inte att motiveras.
GÄr vidare... Vad finns dÀr? Vi antar vad andra mÀnniskor gör. Enligt vÄr mening Àr det mest adekvata sÀttet att bedöma anvÀndarnas intressen. Till exempel pÄ VKontakte finns det inget likes-flöde, och folk tror att ingen vet vad de gillar. Ja, en del av likesna introduceras pÄ Instagram, vi ser nÄgot pÄ Facebook, men det mesta av innehÄllet i vissa grupper sÀnder inte detta i ett gemensamt flöde, och folk lever och tror att ingen kommer att veta vad de gillar.
Och genom att samla in visst innehÄll av nÄgot slag som intresserar oss, samla in dessa inlÀgg, samla dessa gilla-markeringar och sedan kontrollera denna person med hjÀlp av denna databas, kan vi med hög noggrannhet avgöra vem han Àr, vad hans öde Àr, vad han Àr intresserad av. Placera honom exakt i en viss social grupp och interagera med honom.
Att köpa en bil förÀndrar beteendet
Jag har ett sÄdant exempel. Jag kommer omedelbart att reservera mig för att mina exempel Àr nÀra-reklam och nÀra-marknadsföring, eftersom, du vet, de flesta fall Àr skyddade av NDA och sÄ vidare. Men det kommer fortfarande att finnas mycket intressant. SÄ, historien med dessa mÀnniskor: det hÀr Àr mÀn som köpte en bil mellan 2010 och 2015. Hur deras sociala beteende online har förÀndrats indikeras med fÀrg. Andelen flickor bland prenumeranterna har förÀndrats, jag prenumererade pÄ "pojkaktiga" offentliga sidor, hittade en permanent sexpartner...
Det hela Àr uppdelat pÄ bilmÀrke och antal personer. HÀrifrÄn kan du dra mÄnga intressanta slutsatser om mÀnniskors beteende och hur det hela fungerar. Jag kan sÀga att Porsche Cayenne och den planterade Priora Àr nÀstan identiska nÀr det gÀller antalet lockade publik. Kvaliteten pÄ denna publik och deras beteende Àr olika, men kvantiteten Àr ungefÀr densamma. Slutsatsen du kan dra hÀrifrÄn Àr vad du vill, nÀrmare din marknad. Om du sÀljer en Audi, gör du sloganen "Köp en Audi och kom bort frÄn dina förÀldrar!" och sÄ vidare.
Ja, det hĂ€r Ă€r ett roligt exempel pĂ„ att mĂ€nniskors beteende baserat pĂ„ analys av likes, baserat pĂ„ vilken grupp de flyttar till, vilket innehĂ„ll de analyserar â med nĂ€stan 100 % sannolikhet gör det tydligt vem du Ă€r. För om du inte har tillgĂ„ng till nĂ€tverkstrafik och inte lĂ€ser personliga meddelanden, kommer likes alltid att berĂ€tta vem den hĂ€r personen Ă€r - en gravid kvinna, en mamma, en militĂ€r, en polis. Och för dig, som kan annonsera, Ă€r detta en stor trĂ€ff pĂ„ mĂ„l.
Svar pÄ frÄgor frÄn publiken:
- Varje kolumn Àr antalet personer i denna bil; hur deras beteendemönster har förÀndrats. Titta: personer som köpte en Porsche Cayenne - cirka 550 personer (gul), andelen tjejer bland prenumeranter har ökat.
- Provet Àr anvÀndare av sociala nÀtverk "Vkontakte", "Facebook", "Instagram" frÄn 2010 till 2015. Det enda förtydligandet: bilarna som valts hÀr Àr de som kan identifieras pÄ fotografier med mer Àn 80 % noggrannhet med hjÀlp av vissa verktyg.
- Under en viss tid, hans bil (nÄja, det vill sÀga inte hans, vi lÀmnar det till sociala nÀtverk)... Under en viss tidsperiod fotograferades en person konstant med bilen, var med den, publikationerna var olika, fotografierna var frÄn olika vinklar och sÄ vidare. Det blir dÄ en bild pÄ vilka personer som tar bilder med vilka bilar och... Ja, det hÀr Àr den andra frÄgan - tillit till sociala nÀtverksdata.
- Eftersom vi tog upp det, Àr sociala mediers data tyvÀrr inte alltid korrekta. MÀnniskor Àr inte alltid benÀgna att publicera sin information. Personligen genomförde jag en sÄdan studie: jag jÀmförde antalet utexaminerade frÄn Moskvas universitet med antalet personer som Àr registrerade pÄ sociala nÀtverk. I genomsnitt Àr 60% fler mÀnniskor registrerade pÄ sociala nÀtverk - utexaminerade frÄn Moscow State University under ett visst Är i vissa specialiteter - Àn vad det faktiskt Àr i princip. SÄ ja - det finns naturligtvis en procentandel av fel hÀr, och ingen döljer det. HÀr tar vi helt enkelt till utgÄngspunkt de bilar som kan identifieras med mer Àn 80% sannolikhet.
Lista över kÀllor för modelltrÀning
HÀr Àr en exempellista pÄ kÀllor som kan anvÀndas, som anvÀnds för att med stor sÀkerhet faststÀlla vilken social profil en person har, vem han Àr.
Vi tar en profil frÄn sociala nÀtverk, frÄn CIAN - kostnaden för en lÀgenhet Àr ungefÀr, "Head-Hunter", "Superjob" - detta Àr den genomsnittliga lönen för en viss person. Jag hoppas att det inte finns nÄgra Head Hunter-representanter hÀr, för de tycker att det inte Àr sÀrskilt bra att ta dessa uppgifter frÄn dem. Detta Àr dock medellönen i vissa regioner för vissa typer av verksamheter för lediga tjÀnster.
"Avito", "Avto.ru": mycket ofta, nÀr deras telefon Àr upplyst, har de det definitivt (i ett stort antal fall) Ätminstone nÄgot pÄ "Avito", eller pÄ "Avto.ru", eller pÄ en annan flera webbplatser dÀr du kan förstÄ vilka de Àr. Om en barnvagn eller en bil sÄldes pÄ detta telefonnummer... Rosstat och Unified State Register of Legal Entities Àr fortfarande fler register med hjÀlp av vilka du kan rangordna det anstÀllande företaget - enligt nÄgon formel, enligt en modell som vilken person som helst kan stÀlla in (du kan ungefÀr bestÀmma denna persons pengar etc.).
Tinder hjÀlper till att samla in data om mÀnniskors situation
Dessutom finns det en sÄ intressant sak (alternativt Àr det vÀldigt roligt i studien) - det hÀr Àr Äterigen insamlingen av data frÄn Moskva Tinder med hjÀlp av bots för denna Tinder. AvstÄndet till mÀnniskor bestÀmdes och sedan bestÀmdes deras ungefÀrliga plats.
Syftet med denna studie var att faststÀlla antalet Tinder-konton pÄ statliga institutioners territorium - i duman, Äklagarmyndigheten och sÄ vidare. Men du som annonsör kan förestÀlla dig vad du vill: det kan vara till exempel Starbucks eller nÄgon annan... Det vill sÀga hur mÄnga pÄ Tinder som dricker kaffe av dig, bestÀller nÄgot, Àr i butik AngÄende denna geolokalisering: detta kan göras med vilken tjÀnst som helst.
Svar pÄ en frÄga frÄn publiken:
- Tinder? Du vet inte? Tinder Àr en dejtingapp dÀr du tittar igenom bilder (vÀnster-höger), och den hÀr appen visar dig avstÄndet till personen. Om du fÄr avstÄndet till denna person frÄn tre olika punkter kan du ungefÀr (+ 5-7 meter) bestÀmma platsen. I det hÀr fallet, för beslut pÄ Äklagarmyndighetens eller statsdumans territorium, Àr det inte sÄ svÄrt. Men Äterigen, det kan vara din butik, det kan vara vad som helst.
Till exempel, för lÀnge, lÀnge sedan hade vi ett sÄdant fall (inte en studie), nÀr vi fick frÄn en av mobiloperatörerna data om trafiktÀthet, data om tÀtheten av rörelse för cellulÀra punkter, och all denna information överlagrades pÄ koordinaterna för skyltar som finns pÄ motorvÀgar. Och mobiloperatörens uppgift Àr att avgöra ungefÀr hur mÄnga mÀnniskor som gÄr förbi och potentiellt kan se denna skyltannons.
Om det finns reklamspecialister hĂ€r kan du sĂ€ga: det Ă€r omöjligt att förstĂ„ med supertillförlitlighet - nĂ„gon kommer, nĂ„gon tittade inte, nĂ„gon tittade... ĂndĂ„ Ă€r detta ett exempel pĂ„ hur det finns 20 miljarder polygoner av dessa i Moskva, dĂ€r Ă€r tĂ€theten av dessa mĂ€nniskor varje timme lĂ€ngs vissa rutter... Du kan se vad dessa mĂ€nniskor passerade nĂ€r som helst och grovt uppskatta passagerarflödet.
Svar pÄ en frÄga frÄn publiken:
- Ingen ger sÄdana uppgifter. Vi genomförde en sÄdan studie för en av operatörerna; det hÀr Àr en uteslutande intern historia, sÄ den presenteras tyvÀrr inte i form av bilder. Men ofta har stora reklambyrÄer inga problem att kontakta en operatör. à tminstone i Moskva finns det mÄnga prejudikat nÀr till exempel försÀkringsbolag vÀnder sig till företag som GetTaxi, som tillhandahÄller opersonliga uppgifter om förarens Älder, hur de kör (bra - dÄligt, hÀnsynslöst - nej), för att förutsÀga politik och sÄ vidare. Alla kÀmpar med detta, men pÄ nÄgon intern nivÄ, att ge anonym data - jag tror att ingen har ett sÄdant problem.
Bild- och mönsterigenkÀnning
VarsÄgod. Min favorit Àr bildigenkÀnning. Det kommer att finnas ett litet stycke om att söka efter mÀnniskor med ansikten, men vi tar för det mesta inte denna del. Vi tar specifikt bildigenkÀnning och bestÀmmer vad som finns i denna bild - bilens mÀrke, dess fÀrg och sÄ vidare.
Jag har det hÀr roliga exemplet:
Det gjordes en sÄdan studie om att söka efter tatueringar pÄ olika sociala nÀtverk. Följaktligen kan samma sak tillÀmpas pÄ vilket varumÀrke som helst, pÄ vilken visuell bild som helst, pÄ nÀstan vilken visuell bild som helst. Det finns de som inte kan faststÀllas tillförlitligt (vi tar dem inte).
HÀr Àr min favorit. BilmÀrken vÀnder sig ganska ofta till denna uppgift eftersom deras uppgift till exempel Àr att hitta alla Àgare till nÄgon BMW X6, förstÄ vilka de Àr, hur de Àr kopplade till varandra, vad de Àr intresserade av och sÄ vidare. Detta relaterar till frÄgan om vilka bilar folk tar bilder med pÄ sociala nÀtverk.
HĂ€r fanns ingen filtrering alls: föremĂ„let var deras, bilen var inte deras; Det Ă€r bara uppdelningen av bilar â Ă„lder och sĂ„ vidare. Men visuell bildigenkĂ€nning anvĂ€nds ganska ofta: det hĂ€r Ă€r sökandet efter gravida kvinnor och sökandet efter varumĂ€rkeslogotyper i nĂ„gon form av massmedia (vem lĂ€gger upp vad).
Mitt favoritfall (som anvÀnds av olika restauranger): vilken typ av semlor lÀggs upp pÄ ett socialt nÀtverk. Det Àr en rolig sak, men i sjÀlva verket lÄter det dig förstÄ mÄnga intressanta saker, för det första om dina egna kunder: vem som kom till dig och varför de gjorde det. För det Àr ingen hemlighet att pÄ sushibarer tar de flesta (jag sÀger inte "tjejer") bilder för att checka in, ta ett foto av nÄgot osv.
Detta kan varumÀrket dra nytta av. VarumÀrket Àr intresserad av vilken typ av produkter det behöver för att vackert fotografera och posta, vilken typ av mÀnniskor som kom dit. Det hÀr kan göras med nÀstan vad som helst, frÄn mat.
VideomönsterigenkÀnning
Svar pÄ en frÄga frÄn publiken:
- Inte pÄ video. Vi har den i testlÀge. Vi provade den hÀr tekniken, men det visar sig att... Den kÀnner igen allt med video ganska bra, men vi har inte hittat en applikation för den nÄgonstans. HejdÄ. Förutom att analysera hur mycket och vilka videobloggare som pratar nÄgonstans... Det gjordes en sÄdan studie. Hur mÄnga av deras ansikten trÀffas, hur ofta. Men mÀrken har inte kommit pÄ var de ska komma med detta Àn. Kanske kommer det nÄgon gÄng.
à terigen, detta Àr mat, det kan vara gravida kvinnor, mÀn (inte gravida), bilar - vad som helst.
Som ett alternativ fanns det en nyÄrsstudie för en media. OcksÄ lÄngt ifrÄn reklam, men ÀndÄ. Det hÀr Àr vilken typ av mat folk fastade för det nya Äret:
Det Àr ocksÄ uppdelat efter Älder hÀr. Man kan se en sÄdan korrelation att unga för det mesta bestÀller mat, vuxna mest gör ett traditionellt bord. Det Àr en rolig sak, men om du förestÀller dig det som en varumÀrkesÀgare kan du utvÀrdera ett stort antal saker: vem som hanterar din produkt och hur, vad de skriver om den. Ofta nÀmner mÀnniskor inte alltid sjÀlva varumÀrket i texten, och traditionella analytiska övervakningssystem kan inte alltid förstÄ och hitta detta omnÀmnande av varumÀrket enbart för att det inte nÀmns i texten. Eller sÄ Àr texten felstavad, det finns inga hash-taggar eller nÄgot.
Bilderna Àr synliga. Med fotografering kan du se om det Àr mittmotivet i ramen eller inte mittmotivet i ramen. DÄ kan du se vad den hÀr personen skrev. Men oftast anvÀnds det som ett sökande efter potentiella publik som har kört vissa bilar och sÄ vidare. Och sÄ kommer vi att göra mÄnga intressanta saker med dessa bilar.
Bots lÀrs ut att imitera mÀnniskor
Det fanns ocksÄ ett sÄdant alternativ för att anvÀnda personer som rÀknar:
Det finns ett alternativ för att jĂ€mföra mĂ€nniskor, nĂ€r du behöver hitta personer som anvĂ€nder nĂ„gra fotografier, förstĂ„ deras sociala profil, vilka de Ă€r. Ă
terigen, vi ÄtervÀnder till frÄgan att om vi har en kamera i en offlinebutik sÄ Àr detta ett ganska bra sÀtt att förstÄ vem som kommer till dig, vilka dessa mÀnniskor Àr, vad de Àr intresserade av, vad som fick dem att komma till dig .
DÀrefter kommer det mest intressanta: om vi samlar deras konton pÄ sociala nÀtverk, förstÄr vilka dessa personer Àr, vad de Àr intresserade av, kan vi (som ett alternativ) göra en bot som liknar dessa mÀnniskor; denna bot kommer att börja leva som dessa mÀnniskor och analysera vilka annonser den ser pÄ olika sociala nÀtverk. Detta gör att du exakt kan förstÄ vilka varumÀrken som riktar sig till den hÀr personen. Detta Àr ocksÄ en ganska vanlig historia nÀr du inte bara behöver analysera vem den hÀr personen Àr och vilka intressen han har, utan ocksÄ vilken typ av reklam dina potentiella konkurrenter eller andra intresserade ska rikta in sig pÄ.
Analys av kopplingar i sociala nÀtverk
NÀsta intressanta sak Àr analysen av relationer mellan mÀnniskor. Faktiskt, analysen av anslutningar i nÀtverket, dessa nÀtverksgrafer - det finns inte lite, inget nytt i detta, alla vet detta.
Men applikationen till reklamuppgifter Àr den mest intressanta. Detta Àr ett sökande efter personer som sÀtter trender, detta Àr ett sökande efter personer som sprider information enligt vissa kriterier inom detta nÀtverk. LÄt oss sÀga att vi Àr intresserade av samma Àgare av en viss BMW-modell. Genom att sammanföra dem alla kan vi hitta dem som styr den allmÀnna opinionen. Dessa Àr inte nödvÀndigtvis bilbloggare och sÄ vidare. Vanligtvis Àr dessa enkla kamrater som sitter pÄ olika offentliga sidor, Àr intresserade av nÄgot innehÄll och kan pÄ mycket kort tid locka ditt varumÀrke eller nÄgon av intresse för dig till detta ansvarsomrÄde, till omrÄdet för intresse.
Det finns ett sÄdant exempel hÀr. Vi har nÄgra potentiella mÀnniskor, kopplingar mellan mÀnniskor. HÀr Àr de orangea mÀnniskor, de smÄ prickarna Àr gemensamma grupper, gemensamma vÀnner.
Om du samlar alla dessa kopplingar mellan dem, kan du mycket tydligt se att det finns mÀnniskor som har ett stort antal gemensamma grupper, gemensamma vÀnner, de Àr dÀr sinsemellan... Och om samma visualisering Àr indelad i grupper efter intressen, efter innehÄll, vilket de distribuerar, hur mycket de interagerar med varandra... HÀr kan du se att förra bilden blev sÄ hÀr:
HÀr Àr grupperna tydligt sÀrskiljda genom fÀrg. I det hÀr fallet Àr det vÄra masterstudenter pÄ Handelshögskolan. HÀr kan du se att de lila/blÄ Àr de som Àlskar Transparency International, Open Russia och Khodorkovskys offentliga sidor. LÀngst ner till vÀnster Àr de gröna, de som Àlskar Förenade Ryssland.
Man kan se att den förra bilden var sÄ hÀr (detta Àr bara kopplingar mellan mÀnniskor), men har blivit tydligt avgrÀnsad. Det vill sÀga, alla mÀnniskor Àr alltid förbundna med varandra, de har samma intressen, de Àr vÀnner med varandra. Det finns nÄgra pÄ toppen, andra pÄ botten och nÄgra andra kamrater dÀr. Och om var och en av dessa smÄ subgrafer visualiseras separat med andra parametrar och tittar pÄ hastigheten för innehÄllsspridning (i grova drag, vem postar vad dÀr), kan du i varje del hitta en eller tvÄ personer som alltid hÄller den allmÀnna opinionen i sina hÀnder, interagera med vilket, frÄga skicka nÄgon form av inlÀgg eller nÄgot annat - du kan fÄ svar frÄn hela denna intressanta publik.
Jag har ett annat sÄdant exempel. OcksÄ en graf: dessa Àr BBDO Group-anstÀllda som finns pÄ sociala nÀtverk som ett exempel. Det ser ointressant ut, stort, grönt, kopplingar mellan dem...
Men jag har ett alternativ dÀr grupper redan Àr byggda mellan dem. Sedan, om nÄgon Àr intresserad, finns det en interaktiv version - du kan klicka och ta en titt.
Ăverst till höger Ă€r de som Ă€lskar Putin. HĂ€r Ă€r de lila designers; de som Ă€r intresserade av design, nĂ„got intressant och sĂ„ vidare. HĂ€r Ă€r de vita sakerna ledningsgruppen (tydligen, som jag förstĂ„r); Det Ă€r personer som generellt sett inte Ă€r sammankopplade pĂ„ nĂ„got sĂ€tt utan jobbar pĂ„ ungefĂ€r samma positioner. Resten Ă€r deras gemensamma grupper, kopplingar och sĂ„ vidare.
VarumÀrken behöver inte bloggare, utan opinionsbildare
Vi tar dessa personer och hittar dem - sedan bestÀmmer reklambyrÄn, reklamföretaget sjÀlv: det kan ge pengar till den hÀr personen sÄ att han pÄ nÄgot sÀtt interagerar med detta innehÄll, nÄgot annat, eller rikta sin egen specifika reklamkampanj till dem. Detta anvÀnds ocksÄ ganska ofta, speciellt nu, eftersom alla varumÀrken vill arbeta med bloggare, de vill att deras innehÄll ska marknadsföras, men reklambyrÄer vill inte riktigt kontakta (ja, det hÀr hÀnder).
Och den verkliga vÀgen ut ur den hÀr situationen Àr att hitta mÀnniskor som inte Àr bloggare, inte skönhetsbloggare, men till exempel nÄgra riktiga varelser som interagerar med detta varumÀrke, som kan skriva pÄ nÄgon elÀndig offentlig sida "Mail.ru Answers", fÄ ett visst antal visningar. Dessa mÀnniskor, som stÀndigt Àr intresserade av denna persons innehÄll, kommer att sprida det hela, och varumÀrket kommer att fÄ sitt engagemang.
Det andra alternativet för att anvÀnda sÄdan teknik nu Àr ganska relevant - att söka efter bots, min favorit. Detta Àr en anseenderisk för dina konkurrenter och en möjlighet att sÄlla bort irrelevanta personer frÄn en reklamkampanj och allt annat (ta bort kommentarer och söka efter kopplingar mellan mÀnniskor). Jag har ett sÄdant exempel, det Àr ocksÄ stort och interaktivt - du kan flytta det. Det hÀr Àr kopplingar till personer som skrev kommentarer i Lentach-communityt.
Det hĂ€r exemplet Ă€r sĂ„ att du förstĂ„r hur bra och lĂ€tt synliga bots Ă€r; och för detta behöver du inte ha nĂ„gra tekniska kunskaper. Detta betyder att "Lentach" publicerade ett inlĂ€gg om FBK-utredningen om Dmitrij Medvedev, och vissa personer började skriva kommentarer. Vi samlade alla personer som skrev kommentarer â dessa mĂ€nniskor Ă€r gröna. Nu ska jag flytta det:
Folket Ă€r de gröna (som skrev kommentarerna). De Ă€r hĂ€r, de Ă€r hĂ€r. De blĂ„ prickarna mellan dem Ă€r deras gemensamma grupper, de gula prickarna Ă€r deras vanliga prenumeranter, vĂ€nner och sĂ„ vidare. De flesta mĂ€nniskor Ă€r förbundna med varandra. För, oavsett teorin om tre, fyra, fem handslag, Ă€r alla mĂ€nniskor kopplade till varandra pĂ„ sociala nĂ€tverk. Det finns inga mĂ€nniskor som Ă€r separerade frĂ„n varandra. Ăven mina socialt fobiska vĂ€nner som anvĂ€nder VKontakte enbart för att titta pĂ„ videor prenumererar fortfarande pĂ„ nĂ„gra av samma offentliga sidor som vi.
Navalnyj anvÀnder ocksÄ bots. Alla har bots
Huvuddelen av mÀnniskor (hÀr Àr det, hÀr) Àr kopplade till varandra. Men det finns en sÄ liten grupp av kamrater som Àr vÀnner uteslutande med varandra. HÀr Àr de, de smÄ gröna, hÀr Àr deras gemensamma vÀnner och grupper. De föll till och med separat hÀr:
Och av en lycklig slump var det just dessa personer som skrev under det hĂ€r inlĂ€gget: "Navalnyj har inga bevis" och sĂ„ vidare, skrev samma kommentarer. SjĂ€lvklart vĂ„gar jag inte dra nĂ„gra slutsatser. Men Ă€ndĂ„ hade jag ett annat inlĂ€gg pĂ„ Facebook, nĂ€r det var en debatt mellan Lebedev och Navalnyj analyserade jag kommentarerna pĂ„ samma sĂ€tt: det visade sig att alla mĂ€nniskor som skrev "Lebedev Ă€r skit", de hade inte varit pĂ„ sociala medier nĂ€tverk nyligen fyra mĂ„nader, inte prenumererar pĂ„ nĂ„gon av de offentliga sidorna, plötsligt gick till det hĂ€r inlĂ€gget, skrev denna exakta kommentar och gick. Ă
terigen, det Àr omöjligt att dra slutsatser hÀrifrÄn, men nÄgon frÄn Navalnys team skrev en kommentar till mig om att de inte anvÀnder bots. NÄvÀl, okej!
NĂ€rmare reklam, nĂ€rmare varumĂ€rket. Alla har bots nu! Vi har dem, vĂ„ra konkurrenter har dem och andra har dem. De mĂ„ste kastas ut eller lĂ€mnas för att leva gott; Baserat pĂ„ sĂ„dana data (pekar pĂ„ föregĂ„ende bild), ta dem till perfektion sĂ„ att de ser ut som riktiga mĂ€nniskor och anvĂ€nd dem först dĂ„. Ăven om det Ă€r dĂ„ligt att anvĂ€nda bots! ĂndĂ„ en ganska vanlig historia...
I automatiskt lÀge lÄter en sÄdan sak att du frÄn din analys filtrerar bort personer som Àr irrelevanta för analysen, personer som inte ska ingÄ i urvalet ska inte ingÄ i denna studie. Mycket ofta anvÀnd. à terigen, inte alla bilÀgare Àger faktiskt bilar. Ibland Àr folk bara intresserade av personer som potentiellt har en bil, som sitter i vissa grupper, kommunicerar med nÄgon, de har en viss publik dÀr.
Analys av fakta och Ă„sikter
NÀsta jag har Àr ocksÄ min favorit. Detta Àr en analys av fakta och Äsikter.
Nuförtiden vet alla hur man nĂ€mner sitt varumĂ€rke i olika kĂ€llor. Det finns ingen hemlighet med detta. Och alla verkar kunna berĂ€kna tonalitet... Ăven om jag personligen tycker att sjĂ€lva tonalitetsmĂ„ttet inte Ă€r sĂ€rskilt intressant, för nĂ€r du kommer och sĂ€ger till klienten, "Man, du har 37% neutral", och han sĂ€ger sĂ„ , "Wow! HĂ€ftigt!" DĂ€rför skulle det vara mer intressant att gĂ„ lite lĂ€ngre: frĂ„n att bedöma sentiment till att bedöma Ă„sikterna om vad de sĂ€ger om din produkt.
Och det hÀr Àr ocksÄ en vÀldigt intressant sak, för... Jag tror personligen att det i princip inte kan finnas nÄgra neutrala budskap, för om en person skriver nÄgot i det offentliga rummet Àr det hÀr meddelandet pÄ nÄgot sÀtt fÀrgat pÄ nÄgot sÀtt. Jag personligen har aldrig sett ett neutralt budskap som nÀmner ett varumÀrke. Vanligtvis Àr det nÄgon form av smuts.
Om vi ââtar ett stort antal av dessa meddelanden (det kan finnas miljoner, 10 miljoner), lyfter fram huvudidĂ©n frĂ„n varje meddelande, kombinerar dem, vi kan ganska tillförlitligt förstĂ„ vad folk sĂ€ger om detta varumĂ€rke, vad de tycker. "Jag gillar inte förpackningen", "Jag gillar inte konsistensen" och sĂ„ vidare.
Vad tycker folk om Transaero, Chupa Chups och USA:s president?
Jag har ett roligt exempel: det hÀr Àr en infografik om vad anvÀndare av sociala nÀtverk skulle göra med Transaero-företaget efter dess konkurs.
Det finns mĂ„nga intressanta exempel dĂ€r: brĂ€nna, döda, deportera till Europa, det var till och med 2% som skrev - "Skicka dem till Syrien för militĂ€ra operationer." Om vi ââgĂ„r vidare frĂ„n det roliga kan det vara nĂ€stan vilket mĂ€rke som helst - frĂ„n min favorithundmat till nĂ„gra bilar. Den som inte gillar förpackningen, den som inte gillar riktiga saker â du kan alltid arbeta med detta, du kan alltid ta hĂ€nsyn till detta. Det finns ett stort antal exempel nĂ€r folk nĂ€stan Ă€ndrade produktionen av sina produkter för att de skrev pĂ„ sociala nĂ€tverk att Chupa Chups inte var tillrĂ€ckligt rund eller att den inte var tillrĂ€ckligt söt.
Det finns ett annat roligt exempel. Gissa vilka kommentarer och om vem?
Av nĂ„gon anledning Ă€r nu analysen av Ă„sikter, analysen av fakta extraherad frĂ„n meddelanden, inte sĂ€rskilt anvĂ€nd och Ă€r inte sĂ€rskilt utbredd. Ăven om den hĂ€r tekniken inte Ă€r superhemlig, finns det praktiskt taget ingen kunskap i detta alls, eftersom det inte krĂ€vs ett geni i berĂ€kningslingvistik frĂ„n mĂ€nniskors kommentarer, att extrahera Ă€mnet, predikat och gruppera dem. Det Ă€r inte sĂ„ svĂ„rt att göra. Men jag hoppas att folk kommer att börja anvĂ€nda det hĂ€r under de nĂ€rmaste Ă„ren, för... Det kommer att bli coolt - det hĂ€r Ă€r en sĂ„dan automatisk feedback! Du vet alltid vad de sĂ€ger om dig. Du förstĂ„r att det hĂ€r gjordes om USA:s president.
Svar pÄ en frÄga frÄn publiken:
- Ja, det hÀr Àr Facebook pÄ engelska. De Àr översatta till ryska hÀr. Det hÀr skrevs nÄgonstans.
Big Data och politisk teknik
Jag har faktiskt mÄnga olika intressanta exempel pÄ politik om Trump och alla andra, men vi bestÀmde oss för att inte ta dem hit. Men det finns ett politiskt exempel.
Det hÀr Àr val till statsduman. NÀr var du? Förra Äret? För snart ett och ett halvt Är sedan.
HÀr Àr personer som kunde bestÀmma sin exakta plats, ner till en viss geopunkt, för att förstÄ vilket valomrÄde de hamnar i. Och sedan togs frÄn dessa mÀnniskor bara de som uttryckte sin bestÀmda Äsikt, som de skulle rösta pÄ.
Ur politisk tekniks synvinkel Ă€r detta inte sĂ€rskilt korrekt, eftersom det hela mĂ„ste normaliseras av befolkningstĂ€thet och sĂ„ vidare. ĂndĂ„ kommer de blĂ„ hĂ€r att rösta pĂ„ du vet vem, de röda kommer att rösta pĂ„ oppositionskamrater, av vilka det förresten inte var mĂ„nga.
Jag tror personligen att Big Data inte kommer att nÄ politisk teknologi inom kort, men som ett alternativ Àr kandidaten ocksÄ ett varumÀrke. Och detta Àr ocksÄ, till viss del, en analys av fakta och Äsikter om ditt varumÀrke, och en ganska intressant sak, eftersom du i realtid kan förstÄ vem som gör vad. Jag kÀnner till flera fall frÄn BBC, nÀr de övervakade sociala nÀtverk i realtid i nÄgon sÀndning: det var ett sÄdant och ett sÄdant svar, folk skriver om det, stÀller en sÄdan och en frÄga - och det Àr fantastiskt! Jag tror att den kommer att anvÀndas vÀldigt snart, för den Àr intressant för alla.
Modellera varumÀrkespositioner
DÀrefter har jag modellering av varumÀrkespositioner. Ett litet kort stycke om hur du kan ranka varumÀrken med hjÀlp av olika mÀtvÀrden (inte som prenumeranter pÄ sociala nÀtverk, utan med hjÀlp av komplexa mÀtvÀrden, intresse för innehÄll, tid för att ta emot mÀtvÀrden).
Jag har ett exempel pĂ„ "pharma" av en viss anledning. HĂ€r Ă€r de smĂ„ cirklarna interna, ljusa â det hĂ€r Ă€r mĂ€ngden textinnehĂ„ll som varumĂ€rket sjĂ€lv skapar, den stora cirkeln Ă€r mĂ€ngden foto- och videoinnehĂ„ll som varumĂ€rket sjĂ€lv skapar.
NÀrheten till centrum visar hur intressant innehÄllet Àr för publiken. Det finns en stor modell, det finns en massa alla möjliga parametrar: gilla-markeringar, reposter, svarstid, vem som delade dÀr i snitt... HÀr kan du se: det finns en underbar "Kagotsel", som pumpar en enorm mÀngd pengar till att skapa eget innehÄll, och pÄ grund av detta ligger de ganska nÀra centrum. Och det finns kamrater som ocksÄ skapar sitt eget innehÄll, men publiken Àr inte intresserad av det. Detta Àr inte ett sÀrskilt adekvat exempel, eftersom alla dessa konton Àr praktiskt taget döda.
Yegor Creed Àr Àlskad mer Àn Basta
TyvÀrr, resten... frÄn vad man ska visa... Jo, det finns ocksÄ ryska rappare, som tillval, frÄn riktiga företag.
Vad Àr pluset? Faktum Àr att ett företag kan lÀgga nÀstan vad som helst i en sÄdan modell, frÄn den genomsnittliga lönen för prenumeranter som arbetar för ditt varumÀrke; vilken modell de gillar. Eftersom varje reklambyrÄ berÀknar sina egna mÀtvÀrden pÄ olika sÀtt, berÀknar varumÀrken sina egna mÀtvÀrden pÄ olika sÀtt.
Det finns ocksĂ„ en hĂ€r â Basta, som genererar en stor mĂ€ngd innehĂ„ll, men som ligger i periferin, eftersom detta innehĂ„ll tydligen inte Ă€r sĂ€rskilt intressant för publiken. Ă terigen, jag antar inte att döma. Men Ă€ndĂ„ finns det Yegor Creed, som enligt sociala nĂ€tverk Ă€r nĂ€stan den bĂ€sta artisten i vĂ„r tid, men publicerar bara sina personliga fotografier. ĂndĂ„ har han ett stort antal prenumeranter: det finns nĂ„gonstans runt en miljon av dem. Jag minns inte det exakta antalet; Jag minns att andelen engagemang för dessa mĂ€nniskor Ă€r mycket högre Ă€n 85%, det vill sĂ€ga per miljon prenumeranter fĂ„r han 850 tusen svar frĂ„n dessa riktiga mĂ€nniskor - det hĂ€r Ă€r riktigt galenskap. Detta Ă€r sant.
Svar pÄ frÄgor frÄn publiken:
Hur lÄng tid tog det att skapa rapparanalysmodellen?
- Var och en har sin egen mÄlgrupp, dessa mÀnniskors intressen berÀknas för varje... Allt detta Àr normaliserat till avstÄndet till centrum ungefÀr, deras radiella position Àr inte viktig (det Àr helt enkelt utsmetat hÀr för skönhet, sÄ att de gör det inte stöta pÄ varandra). Endast den ungefÀrliga nÀrheten till centrum Àr viktig. Det Àr den hÀr modellen vi anvÀnder. Jag gillar till exempel cirkeln bÀttre, vissa gör den i Ätanke som en halvcirkel.
- Denna modell kompilerades snabbt, pÄ tvÄ eller tre timmar (ja, en person). HÀr infogades bara mÄtt: vad vi multiplicerar med vad, lÀgger ihop det och sedan pÄ nÄgot sÀtt normaliserar det. Beror pÄ modellen. Det finns mÀnniskor som Àr intresserade av genomsnittslönen (detta Àr inte ett skÀmt) för sina prenumeranter. Och för detta mÄste du hitta deras kontakter, Avito, berÀkna allt, multiplicera det. Det hÀnder att detta tar lÄng tid att ta hÀnsyn till, men specifikt detta (pekar pÄ föregÄende bild) - parametrarna hÀr Àr vÀldigt enkla: prenumeranter, reposter och sÄ vidare. Det tog ungefÀr tvÄ till tre timmar att genomföra. Följaktligen uppdateras den hÀr saken i realtid och du kan anvÀnda den.
Nu kommer den roliga delen. Jag Àr klar med exempel, för det Àr inte intressant att prata lÀnge ensam. Och jag hoppas att du nu kommer att stÀlla frÄgor, och vi kommer faktiskt att gÄ frÄn Àmne till Àmne, för jag har sÄdana exempel pÄ hur teknologier kan anvÀndas och sÄ vidare...
Svar pÄ frÄgor frÄn publiken:
- Jag hade ett och enda personligt fall med ett sÄ att sÀga "nÀra-casino", nÀr en kamera placerades dÀr, ansikten kÀndes igen, och sÄ vidare. Andelen personer som identifieras Àr definitivt ganska stor - bÄde vÄr och vÄra konkurrenter. Men det Àr faktiskt ganska intressant. Jag ser detta som en intressant sak: du kan förstÄ vilka dessa mÀnniskor Àr och förutsÀga ganska bra varför just de kom hit, vad som har förÀndrats sÄ mycket i deras liv att de bestÀmde sig för att komma till kasinot. Men nÀr det gÀller specifika typer av affÀrer ... Om du lÀgger en sÄdan sak pÄ ett apotek, Àr det ingen mening - du kan inte förutsÀga varför en person kom till apoteket.
Den globala uppgiften hĂ€r var att bygga en modell för att förstĂ„ nĂ€r en person potentiellt vill vara intresserad av ditt varumĂ€rke, sĂ„ att du kan ge honom reklam inte efter att han har köpt nĂ„got (som hĂ€nder nu), utan ge honom reklam " i prognosenâ nĂ€r allt detta kommer att hĂ€nda. Det var intressant med ett sĂ„dant "nĂ€ra-casino"; det visade sig vara en ganska intressant andel av dessa mĂ€nniskor - varför: nĂ„gon fick plötsligt en befordran, nĂ„gon annan fick nĂ„got annat - sĂ„ intressanta insikter. Men med vissa butiker, med detaljhandel, med en butik av nĂ„gon sorts piller, verkar det för mig att det inte kommer att vara sĂ€rskilt korrekt.
AnvÀnds Big Data offline?
- Det var offline. Du behöver bara förstĂ„ exakt, ungefĂ€r, om den hĂ€r modellen passar eller inte. Ă terigen, med kolsyrat vatten... Jag Ă€r faktiskt intresserad av allt, men jag förstĂ„r personligen inte hur mycket, hur dessa personers profiler, deras beteende kan bero pĂ„ nĂ€r de vill köpa vatten pĂ„ flaska. Ăven om detta verkligen kan vara sant, jag vet inte.
Hur mÄnga öppna sociala medier-konton finns det?
- Vi har specifikt 11 sociala nÀtverk - dessa Àr "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagram" och nÄgra smÄ saker (jag kan titta pÄ listan, som "Mail.ru" och sÄ vidare) . PÄ VKontakte har vi definitivt en kopia av alla dessa kamrater. Vi har mÀnniskor pÄ VKontakte - det Àr 430 miljoner av alla som nÄgonsin har funnits (av vilka cirka 200 miljoner Àr stÀndigt aktiva); det finns grupper, det finns kopplingar mellan dessa mÀnniskor och det finns innehÄll som intresserar oss (text), och en del av media, men vÀldigt smÄ... Grovt sett ser vi pÄ den hÀr bilden: om det finns ansikten dÀr sÄ spara dem, om det finns ett meme, vi sparar dem Vi sparar det inte, för inte ens vi skulle ha tillrÀckligt för att spara medieinnehÄllet.
Det finns en rysksprÄkig Facebook. NÄgonstans nu Àr 60-80% Odnoklassniki, om ett par mÄnader kommer vi förmodligen fÄ dem alla till slutet. Ryska Instagram. För alla dessa sociala nÀtverk finns det grupper, mÀnniskor, kopplingar mellan dem och text.
- Cirka 400 miljoner mÀnniskor. Det finns en subtilitet: det finns mÀnniskor vars stad inte Àr specificerad (de Àr potentiellt ryska / icke-ryska); Av dessa Àr genomsnittet för sociala nÀtverk 14% av stÀngda konton pÄ VKontakte, jag vet inte den exakta siffran pÄ Facebook.
- Vi sparar inte heller media pĂ„ Instagram â bara om det finns ansikten dĂ€r. Vi lagrar inte sĂ„dant (annat) medieinnehĂ„ll. Vanligtvis intressant: endast text, kopplingar mellan mĂ€nniskor; Allt. Den vanligaste forskningen pĂ„ Instagram Ă€r den vanliga forskningen om publiken: vilka dessa mĂ€nniskor Ă€r, och, viktigast av allt, kopplingen mellan dessa mĂ€nniskor och andra sociala nĂ€tverk. Hitta denna persons profil pĂ„ Vkontakte och Facebook för att berĂ€kna hans Ă„lder och sĂ„ vidare.
- Det finns ingen anledning att ta sig an alla andra Ă€nnu â helt enkelt för att det inte finns nĂ„gra kunder. AngĂ„ende sprĂ„ket: vi har ryska, engelska, spanska, men fortfarande anvĂ€nds detta uteslutande för varumĂ€rken frĂ„n Ryssland; ja, eller företagen som tar dem frĂ„n Ryssland.
- Vi intervjuar mÀnniskor varje dag i mÄnga, mÄnga, mÄnga trÄdar: vi samlar in data genom att samla in webben och uppdaterar dessa indikatorer med hjÀlp av Api. PÄ 2-3 dagar kan du gÄ igenom hela "VKontakte", gÄ igenom dem; Om ungefÀr en vecka kan du gÄ igenom hela Facebook och förstÄ vem som har uppdaterat vad och vad som inte har. Och sedan Ätermontera dessa personer separat: vad exakt har förÀndrats, skriv ner hela den hÀr historien. Mycket sÀllan enligt min erfarenhet har nÄgons gamla sociala medieprofil anvÀnts för nÄgot verkligt affÀrssyfte. Detta var den tid dÄ en politisk person ansökte, och hans uppgift var att förstÄ vilken typ av mÀnniskor som kommer till högkvarteret, vilka dessa personer var för 6-8 mÄnader sedan (tog de bort sin profil, men faktiskt för en annan kandidat kom röstsedlar skÀmma bort).
Och ett par gÄnger - personliga berÀttelser nÀr nÄgons fotografier publicerades i offentlig egendom. Det var nödvÀndigt att hitta kopplingar etc. TyvÀrr Àr det synd, men vi kan inte vittna i domstol, eftersom vÄr databas Àr juridiskt illikvid.
- MongoDB-lagring Àr min favorit.
Sociala nÀtverk försöker bekÀmpa datainsamling
- Vanligtvis laddar vi bara upp en lista över dessa konton till annonsörer, och sedan anvÀnder de standarden... Det vill sÀga pÄ sociala nÀtverk, pÄ VKontakte kan du ange en lista över dessa personer.
Men Facebook anvÀnder köpta cookies. Vi sjÀlva arbetar inte med cookies, men det fanns flera historier nÀr annonsören sjÀlv gav nÄgra personer, vi interagerade med dem - de har dessa nÀtverk, med teaser, icke-teaser-reklam, dessa "cookies". Du kan knyta den - ingen frÄga! Men jag gillar inte riktigt det hÀr eftersom jag inte tycker att det Àr sÀrskilt autentiskt. Detta Àr helt enligt min mening, det Àr som TNS, som "spÄr" TV-apparater - det Àr inte klart om du tittar pÄ den hÀr TV:n eller inte, om du diskar medan din TV Àr pÄ... Och det Àr samma sak hÀr : Jag googlar vÀldigt ofta pÄ nÄgot pÄ Internet, men det betyder inte att jag vill köpa det.
- Om du anvÀnder nÄgot slags standardiserat kontextuellt reklamnÀtverk: Jag hade flera historier nÀr vi laddade av dessa personer till dem och försökte, med hjÀlp av deras grÀnssnitt, koppla dem till "cookies" pÄ deras webbplatser. Men jag gillar inte riktigt sÄdana saker.
Formel för att berÀkna lönen för en InternetanvÀndare
- Den allmÀnna formeln för den genomsnittliga lönen: detta Àr regionen dÀr en person bor, det hÀr Àr den kategori av företag dÀr han arbetar (det vill sÀga företaget som Àr hans arbetsgivare), sedan tas hans position i detta företag, genomsnittet lön för denna tjÀnst Àr berÀknad... Medellön hÀmtad frÄn "Head Hunter" och "Superjob" (och det finns flera andra kÀllor) för en given ledig tjÀnst i en viss region och för ett givet affÀrssammanhang.
FrÄn "Avito" och "Avto.ru" tas vanligtvis ytterligare parametrar om en person har belyst telefonen. Med Avito kan du se vilken typ av saker en person sÀljer - dyra, billiga, begagnade, inte anvÀnda. Med "Avto.ru" kan du se om han har en bil - han Àger den, han Àger den inte. Det Àr nÄgonstans mindre Àn 20 % av personerna som av misstag tappade sin telefon nÄgonstans, och deras konto kan kopplas till denna data.
Vilka volymer bedriver datainsamlingsföretaget?
- Volymen av lagrade fotografier i petabyte Àr 6,4. Jag kan inte sÀga exakt tillvÀxttakten nu, för 2016 började vi spela in "periskop" och precis började spela in video.
Jag kan inte sĂ€ga exakt nĂ€r det var noll. Vi flyttade frĂ„n företag till företag â det hĂ€r Ă€r alla lĂ„nga historier. Men jag kan sĂ€ga att VK, Facebook, Instagram och Twitter - all denna verksamhet (mĂ€nniskor, grupper och kopplingar mellan dem) med text och innehĂ„ll - det hĂ€r Ă€r faktiskt inte mycket data, det Ă€r osannolikt att ens en petabyte fick nog. Jag tror att det Ă€r 700 gigabyte, förmodligen 800.
HjÀlper du kunder att bestÀmma den aktuella nisch och var de ska grÀva?
- NÀr en kund kommer föreslÄr vi sÄdana saker för honom, men vi sjÀlva, som Google Trends, gör inte sÄdana saker.
- Vi hade flera nĂ€stan sociologiska berĂ€ttelser, med valhistoria före valet - vi analyserade det hela. Med varumĂ€rken och bedömande Ă„sikter om varumĂ€rken stĂ€mmer nĂ€stan alltid allt. HĂ€r Ă€r val-valhistorier - nej (med en bedömning av vilken kandidat som ska vinna). Jag vet inte vem som har fel hĂ€r â vi eller de som tĂ€nker i VTsIOM.
- Vanligtvis tar vi dessa kontrollresultat frĂ„n sjĂ€lva varumĂ€rket, de tar det frĂ„n kamrater som bestĂ€ller research â telefonundersökningar, marknadsundersökningar och sĂ„ vidare. Plus att det hela kan kontrolleras med grundlĂ€ggande saker: nĂ„gon svarade pĂ„ e-postlistan, nĂ„gon gjorde undersökningar... Om det Ă€r ett stort varumĂ€rke (t.ex. Coca-Cola) har de definitivt en miljon eller tvĂ„ interna recensioner frĂ„n kunder â Det hĂ€r Ă€r inte bara kommentarer pĂ„ sociala nĂ€tverk och vissa Ă„sikter; Det hĂ€r Ă€r nĂ„gon slags interna system, recensioner och sĂ„ vidare.
Lagen "vet" inte vad personuppgifter Àr!
- Vi analyserar uteslutande öppna datakÀllor och blir aldrig inblandade i nÄgra smutsiga knep. VÄr modell bygger pÄ det faktum att vi lagrar all öppen data i vissa offentliga datacenter, hyr den nÄgon annanstans och analyserar den hemma, pÄ vÄra kontor, pÄ vÄra servrar, och den gÄr ingenstans utanför territoriet.
Men vÄr lagstiftning inom omrÄdet öppna data Àr vÀldigt vag.
Vi har ingen klar förstÄelse för vad öppen data Àr, vad personlig data Àr - det finns den hÀr 152:a federala lagen, men ÀndÄ... Hur rÀknas de? Nu, om jag har ditt namn och ditt telefonnummer i en databas, i en annan databas har jag ditt telefonnummer och din e-post, i en tredje har jag, sÀg, din e-post och din bil; Allt detta verkar vara icke-personlig information. LÀgger man ihop allt detta verkar det enligt lagen bli personuppgifter.
Vi kommer runt detta pÄ tvÄ sÀtt. Det första Àr att installera en server med programvara för klienten, och dÄ gÄr dessa data inte utöver hans territorium, och sedan Àr klienten ansvarig för distributionen av dessa personuppgifter, icke-personliga uppgifter och sÄ vidare. Eller det andra alternativet: om det hÀr Àr nÄgon sorts historia dÀr du mÄste stÀmma ett socialt nÀtverk eller nÄgot annat...
Vi hade en sÄdan studie nÀr vi samlade in (det var primÀrval i Förenade Ryssland) för Lifenews dessa kamraters berÀttelser och tittade pÄ vilken typ av porr de gillade. Det var en rolig grej, men ÀndÄ. Vi sÀljer detta som vÄr egen, personliga Äsikt, utan att juridiskt avslöja i dokumenten vad vi analyserade - Unified State Register of Legal Entities, löner, sociala nÀtverk; Vi sÀljer expertutlÄtanden och sedan vid sidan av förklarar vi för personen vad vi analyserat och hur.
Det fanns flera historier, men de var relaterade till nĂ„gra offentliga kommersiella projekt. Till exempel har vi ett kostnadsfritt ideellt projekt för dem som Ă„ker longboard (sĂ„dana brĂ€dor Ă€r lĂ„nga): uppgiften var att samla in folks publikationer - nĂ€r nĂ„gon postar "Jag gick till Gorky Park för en tur." Och nu borde han komma pĂ„ kartan, och folk omkring honom kan se att nĂ„gon Ă€r nĂ€ra honom. VK tjafsade med oss ââom detta Ă€mne under mycket lĂ„ng tid, eftersom de inte gillade det faktum att vi publicerade denna information utan folks tillĂ„telse. Men sedan kom inte saken till domstol, för inom flera stora samhĂ€llen lade vi till reglerna att uppgifterna fick anvĂ€ndas av tredje part, byrĂ„er, företag, analyser etc. Det var förstĂ„s inte speciellt etiskt, men Ă€ndĂ„. - Vi insĂ„g det precis i tid och började sĂ€lja expertutlĂ„tanden till alla.
Arbetar du med utbildningsinstitutioner?
- Vi samarbetar med utbildningsinstitutioner, ja. Vi har en hel rad: vi har ett masterprogram pÄ gymnasiet och vi samarbetar med andra universitet. Vi Àlskar universitet vÀldigt mycket!
- Om du har mina kontakter kan du skriva till mig. Och en lÀnk till presentationen, om nÄgon Àr intresserad - alla dessa exempel finns dÀr, du kan flytta den.
- Om du kÀnner till telefonnumret, e-post - det hÀr Àr nÀstan ett hundraprocentigt alternativ, ingen kommer att ta bort det. Om det inte finns nÄgot telefonnummer Àr det vanligtvis en bild; om det inte finns nÄgon bild Àr det Är, bostadsort, jobb. Det vill sÀga, efter Är, bostadsort och arbete kan nÀstan alla alltid identifieras ganska subtilt. Men det hÀr Àr Äterigen en frÄga om uppgiften.
Vi har, sÀg, en kund som sÀljer internet-tv. NÄgon köpte en prenumeration pÄ dessa "Games of Thrones" av dem, och uppgiften Àr att anvÀnda deras CRM för att hitta dessa personer pÄ sociala nÀtverk och sedan hitta potentiella frÄn deras inflytandeomrÄde. Jag menar bara att de har, sÀg, ett förnamn, efternamn och e-post... Och dÄ Àr det vÀldigt svÄrt att göra nÄgonting. I de flesta fall kan personer hittas via e-post.
- Baserat pĂ„ vĂ„ra vĂ€nners sammansĂ€ttning "matchar" vi vanligtvis mĂ€nniskor pĂ„ sociala nĂ€tverk, men det Ă€r inte alltid korrekt. Det Ă€r inte sĂ„ att det inte alltid Ă€r rĂ€tt â det fungerar inte alltid. För det första krĂ€ver detta mycket arbete, eftersom denna operation (matchande personer) mĂ„ste utföras först för var och en av vĂ€nnerna - för att förstĂ„ om de kom frĂ„n sociala nĂ€tverk eller inte. Och sedan - ett okĂ€nt faktum för alla att pĂ„ VKontakte har vi samma vĂ€nner, pĂ„ Facebook har vi olika vĂ€nner. Inte för alla, men för mig Ă€r det till exempel sĂ„ hĂ€r; och detta Ă€r sant för de flesta ocksĂ„.
Hur samlas de mest fullstÀndiga uppgifterna in?
- Installera programvara för klienten pĂ„ hans sida. En server Ă€r installerad pĂ„ dem, som endast tar offentliga uppgifter frĂ„n oss och behandlar deras personuppgifter internt. En NDA ingĂ„s med klienten. Detta Ă€r naturligtvis inte sĂ€rskilt korrekt att de överför detta till oss, men det juridiska ansvaret vilar pĂ„ klienten â ja, det vill sĂ€ga att installera programvara Ă„t denne, eller överföra anonym data. Men detta var mycket sĂ€llsynt, eftersom - korrekt eller felaktig anonymisering - i de flesta fall förloras beroendet mellan dessa personer.
Vem köper programvara för ansiktsigenkÀnning?
- Vi Ă„ker faktiskt hit eftersom vĂ„r huvudsakliga programvara som vi sĂ€ljer Ă€r ansiktssökning, korrelationsanalys, och vi sĂ€ljer den till statliga myndigheter. Och för ett och ett halvt Ă„r sedan bestĂ€mde vi oss för att vi skulle lĂ€gga alla dessa berĂ€ttelser i reklam, i marknadsföring, pĂ„ den offentliga marknaden â sĂ„ hĂ€r bildades Social Data Hub, en kommersiell juridisk enhet. Och nu kommer vi bara hit. Vi har hĂ€ngt hĂ€r i ett och ett halvt Ă„r nu och försökt förklara för folk att det inte finns nĂ„got behov av att ge folk nedladdningar med ett omnĂ€mnande, att de behöver fĂ„ svar pĂ„ frĂ„gor, att det inte finns nĂ„got behov av tonalitet , och sĂ„ vidare. SĂ„ det Ă€r svĂ„rt att sĂ€ga var...
- (Vem menar du?) Till alla kamrater som behöver leta efter terrorister och pedofiler.
Jag kan sÀga direkt (det hÀr blir nÀsta frÄga): enligt vÄra uppgifter fÀngslades inga lÀrare för ompostering. - PÄ VKontakte - 14%; pÄ Facebook finns det ingen stÀngd profil som sÄdan (det finns en stÀngd lista över vÀnner och sÄ vidare). Och det mest intressanta Àr att jag precis skrev ett meddelande - nu ska de rÀkna och sÀga.
LÀgg inte ut nÄgot du kommer att skÀmmas för!
- LĂ€gg inte ut nĂ„got pĂ„ sociala nĂ€tverk som skulle fĂ„ dig att skĂ€mmas â jag följer personligen detta. Fast jag hade mĂ„nga personliga, för jag svĂ€r pĂ„ Facebook. NĂ„vĂ€l, det fanns och det fanns nĂ„got att göra... LĂ€gg inte upp nĂ„got som skulle vara pinsamt! Om du ska jobba nĂ„gonstans i den offentliga kammaren senare, ja, det Ă€r bĂ€ttre att inte kommentera. Om du inte ska göra detta i stort sett Ă€r det ingen som bryr sig. Jag kan bara försĂ€kra dig om att ingen lĂ€ser din personliga korrespondens, och allt detta bygger upp hela den hĂ€r historien...
Varje vecka kommer nÄgon definitivt till mig och sÀger: "Tja, min vÀns bilder lÀckte till nÄgon anonym offentlig sida! HjÀlp! Publicera förresten aldrig nÄgot pÄ anonyma offentliga sidor.
- Jag vet inte om andra övervakningssystem - vi kommer definitivt att ta hÀnsyn till detta, att omnÀmnandet av varumÀrket var negativt, gud förlÄt mig... Men jag kan sÀga att alla möjliga nÀra-statskamrater bara Àr intresserade av mÀnniskor som har en publik pÄ mer Àn 5 tusen, och deras allmÀnna opinion kan pÄverka nÄgon, sedan pÄverka. Enligt min erfarenhet har det aldrig hÀnt att HR-byrÄn som bestÀller profilbedömningar av oss sa: "Den som gillar Navalnyj, anstÀll inte nÄgon!"
Om att publicera resultaten. Hur mÄnga personer Àr sysselsatta med forskning?
- Av de tio bÀsta reklamföretagen publicerar nu sju. Det Àr svÄrt att sÀga: nÀr vi startade det hÀr för ett och ett halvt Är sedan... Vi har flera personer i varje omrÄde - det finns flera personer i banker, det finns flera personer inom HR, det finns flera personer inom reklam. Och nu funderar vi pÄ vem som Àr mer lönsam att gÄ till först, för vem mÄste vi börja göra nÄgra grÀnssnitt...
- (ungefÀr antal personer per marknadssegment) Inte fler Àn 25 personer, eftersom vi inte vÄldtog nÄgon.
- I allmÀnhet, i princip, anvÀnds dessa tekniker frÄn marknaden, tror jag, med mer Àn 50%. Vissa i annonskampanjer, nÄgra i nÄgon form av intern analys. Jag skulle sÀga att 40 procent anvÀnder det i intern analys, 50-60 procent sÀljer det till slutvarumÀrken. Men detta beror redan pÄ reklamföretagen sjÀlva. Du förstÄr, vissa mÀnniskor rapporterar bara för pengarna som spenderats, reklam de satt upp, medan andra skriver om hur mÄnga mÀnniskor de tog med, vilken typ av publik... Jag skulle sÀga det, men jag kan ha fel - jag har inte Jag kan inte riktigt förestÀlla mig hur alla dessa kamrater fungerar. Jag vet bara i kvantitativ data.
NĂ„gra annonser đ
Tack för att du stannar hos oss. Gillar du vĂ„ra artiklar? Vill du se mer intressant innehĂ„ll? Stöd oss ââgenom att lĂ€gga en bestĂ€llning eller rekommendera till vĂ€nner,
Dell R730xd 2 gÄnger billigare i Equinix Tier IV datacenter i Amsterdam? Bara hÀr
KĂ€lla: will.com