Arthur Khachuyan: "Regte groot data in advertensies"

Op 14 Maart 2017 het Arthur Khachuyan, uitvoerende hoof van Social Data Hub, by die BBDO-lesing gepraat. Arthur het gepraat oor intelligente monitering, die bou van gedragsmodelle, die herkenning van foto- en video-inhoud, sowel as ander Social Data Hub-nutsgoed en navorsing wat jou toelaat om gehore te teiken deur sosiale netwerke en Big Data-tegnologieë te gebruik.

Arthur Khachuyan: "Regte groot data in advertensies"

Artur Khachuyan (hierna - AH): - Hallo! Hi almal! My naam is Arthur Khachuyan, ek bestuur die maatskappy Social Data Hub, en ons is besig met verskeie interessante intellektuele ontledings van oop databronne, inligtingsvelde en doen allerhande interessante navorsing ensovoorts.

En vandag het kollegas van BBDO Group ons gevra om te praat oor moderne tegnologieë vir die ontleding van groot data, groot en nie so groot data vir advertensies: hoe dit gebruik word, wys 'n paar interessante voorbeelde. Ek hoop jy sal vrae langs die pad vra, want ek kan vervelig raak en nie die essensie openbaar nie en so meer, so moenie skaam wees nie.

Eintlik is die hoofrigtings, waar ooit 'n soort "byna-groot-data"-oplossings gebruik is, almal duidelik - dit is gehoorgerigtheid, ontleding, die uitvoer van 'n soort analitiese bemarkingsnavorsing. Maar dit is altyd interessant watter bykomende data gevind kan word, watter bykomende betekenisse gevind kan word nadat die analise toegepas is.

Hoekom het ons tegnologie nodig vir advertensies?

Waar begin ons? Die mees voor die hand liggende ding is om op sosiale netwerke te adverteer. Vandag het ek dit soggens afgehaal: om een ​​of ander rede dink VKontakte ek moet hierdie spesifieke advertensie sien ... Of dit goed of sleg is, is die tweede vraag. Ons sien dat ek beslis in die kategorie van dienspligtiges val:

Arthur Khachuyan: "Regte groot data in advertensies"

Die heel eerste en interessantste ding wat as 'n tegnologiese oplossing geneem kan word... Die eerste ding wat ek wou besluit voordat ons begin, is om die terme te definieer: wat is oop data en wat is groot data? Want alle mense het hul eie begrip oor hierdie saak, en ek wil nie my voorwaardes op enigiemand afdwing nie, maar ... Net sodat daar geen verskille is nie.

Persoonlik dink ek oop data is al wat ek kan bereik sonder enige login of wagwoord. Dit is 'n oop profiel op sosiale netwerke, dit is soekresultate, dit is oop registers, ens. Groot data, volgens my eie begrip, sien ek dit so: as dit 'n dataplaat is, is dit 'n biljoen rye, as dit een of ander soort is van lêerberging, is dit iewers 'n petagreep data. Die res in my terminologie is nie groot data nie, maar so iets.

Hoë-presisie profilering en profieltelling

Kom ons gaan in volgorde. Die heel eerste en interessantste ding waarmee jy vorendag kan kom deur oop databronne te ontleed, is hoë-presisie-profilering en profieltelling. Wat is hierdie? Dit is 'n storie waar jou sosiale netwerk rekening nie net kan voorspel wie jy is nie, nie net jou belangstellings nie.

Maar nou, deur verskeie bronne te kombineer, kan jy die gemiddelde vlak van jou salaris verstaan, hoeveel jou woonstel kos en waar dit geleë is. En al hierdie data kan letterlik van beskikbare middele gebruik word. Byvoorbeeld, as jy jou rekening op 'n sosiale netwerk neem, kyk, sê, waar jy woon, waar jy werk; verstaan ​​in watter afdeling van die besigheid die maatskappy waarvoor jy werk is; laai soortgelyke vakatures by HH en "Superjob" af as jy 'n ontleder, bestuurder, ens. is; kyk na waar jy woon (basis, sê CIAN), verstaan ​​hoeveel dit kos om 'n huis in hierdie plek te huur, hoeveel dit kos om 'n huis in hierdie plek te koop, voorspel ongeveer hoeveel jy verdien. Verder, deur jou sosiale netwerke te gebruik, kan jy verstaan ​​hoeveel jy reis, waar jy is en hoe lojaal jy aan jou werkgewer is.

Gevolglik kan ons uit so 'n groot aantal maatstawwe enigiets doen wat ons wil. Ons kan jou bekendstel aan 'n produk wat jou interesseer. Kan jy jou 'n aanlynwinkel voorstel? Jy gaan soontoe - hierdie aanlyn winkel vang jou rekening op 'n sosiale netwerk en sê vir jou: "Masha, jy het sopas uitgemaak met jou kêrel, hier is 'n paar sekere produkte vir jou." Dit is nie die nabye toekoms nie...

Hoe word 'n persoon se geoligging bepaal?

Antwoorde op vrae uit die gehoor:

  • Tipies word 80% van alle inklokdatums as die presiese woonplek beskou. Maar vir mense wat nêrens inklok nie, is daar verskeie opsies: óf inboek, óf geoligging, of dit is 'n ontleding van plasings en publikasies vir die hele tydperk wanneer 'n persoon iets geskryf het... En iewers, iets sal opduik soos "Ek wil 'n stootwaentjie naby Akademicheskaya koop" of "Ek het onlangs lelike graffiti op die muur hier gesien." Dit wil sê, vir byna 80% van mense kan hul geoligging, hul werkplek en hul woonplek bepaal word met behulp van data of metadata wat van sosiale netwerke ingesamel kan word.

    Dit is weer 'n ontleding van plasings. In die eenvoudigste sin is dit 'n ontleding van aanmeldings en geo-liggings in sosiale netwerke, wat nie jpeg-metadata uitvee nie (jy kan iets daaruit uitvind). Maar vir die oorblywende mense is dit gewoonlik teksuitsendings: óf 'n persoon "skyn" sy ligging wanneer hy oor iets skryf, óf hy "skyn" sy foon, waardeur jy van sy advertensies op Avito of sy rekening kan vind op " Auto RU". Op grond van hierdie data kan jy kombineer (byvoorbeeld, "Ek verkoop 'n motor naby Mayakovskaya") en dit rofweg aanvaar.

  • Mense plaas dit gewoonlik op sosiale media. Ons werk net met oop bronne en hier praat ons uitsluitlik van oop bronne. Hulle publiseer gewoonlik advertensies, dit wil sê in sestig persent van gevalle is die mees algemene storie wanneer mense hul huidige selfoonnommer "gewys" het, advertensies vir die verkoop van iets. Of in sommige groepe skryf 'n persoon ("Ek verkoop dit of dat daar"), of gaan iewers heen.

    Ja! Hulle lewer gewoonlik kommentaar soos: “Antwoord my of stuur vir my ’n SMS, bel my nommer. Dit gebeur baie dikwels met mense wat iets verkoop, iets op sosiale netwerke koop, met iemand kommunikeer... Gevolglik, deur hierdie nommer te gebruik, kan jy dan sy profiel op CIAN daaraan koppel, as hy ooit iets gepubliseer het, of, weer, op Avito. Dit is eenvoudig die gewildste topbronne, dit sal verder wees - dit is Avito, CIAN ensovoorts.

  • Dit verwys na 'n aanlyn winkel. Volgende sal die tegnologie van gesigsherkenning en profielpassing wees (ons sal daaroor praat). Suiwer teoreties kan dit op 'n vanlyn winkel toegepas word. En oor die algemeen is my groot droom dat wanneer straatbaniere verskyn, wanneer jy verby ’n kamera stap, dit jou gesig “vang”. Maar hierdie saak sal deur die wet verbied word omdat dit 'n skending van privaatheid is. Ek hoop dit sal vroeër of later gebeur.
  • Uit persoonlike ervaring. Baie dikwels, wanneer 'n persoon iets vir jou skryf, opereer jy sekere feite uit sy lewe wat jy blykbaar nie behoort te weet nie ... Mense word in die meeste gevalle bang. Maar! Op grond van onlangse statistieke het die aantal geslote rekeninge op sosiale netwerke met 14% afgeneem. Die aantal vervalsings neem toe, die aantal oop rekeninge neem toe - mense beweeg toenemend na openheid. Ek dink hulle sal oor 3-4 jaar ophou om so sterk te reageer op die feit dat iemand inligting oor hulle weet wat hulle moontlik nie behoort te weet nie. Maar dit is eintlik baie maklik om te kry deur na sy muur te kyk.

Wat kan uit oop bronne geneem word?

Daar is 'n benaderde lys van dinge wat met redelike hoë betroubaarheid van oop bronne verstaan ​​kan word. Trouens, daar is selfs meer verskillende maatstawwe; dit hang af van die kliënt van sulke navorsing. Daar is een of ander HR-agentskap wat belangstel of jy op sosiale netwerke of iewers in die openbare ruimte vloek. Iemand stel belang in of jy van Navalny se publikasies hou of, omgekeerd, United Russia-publikasies, of een of ander soort pornografiese inhoud - sulke dinge gebeur nogal gereeld.

Die belangrikste is gesinswaardes, die benaderde koste van 'n woonstel, huis, soek na 'n motor, ensovoorts. Op grond hiervan kan mense in sosiale groepe verdeel word. Dit is Moskou Tinder-gebruikers, wie hulle is (volgens hul foto's wat op hul Facebook-rekeninge gevind is); op grond van hul belangstellings word hulle in verskeie sosiale groepe verdeel:

Arthur Khachuyan: "Regte groot data in advertensies"

As ons nader aan advertensies beweeg, dan het ons stadig wegbeweeg van standaard advertensie-teikening, wanneer jy op VKontakte kies dat jy belangstel in 18-jarige mans wat op sekere groepe ingeteken is. Ek het hierdie foto volgende, ek sal jou nou wys:

Arthur Khachuyan: "Regte groot data in advertensies"

Die slotsom is dat die meeste van die huidige dienste wat in beginsel mense ontleed wat sosiale netwerke ontleed, besig is met die ontleding van belangstellings ... Die eerste ding wat in mense se gedagtes opkom, is om die topgroepe van hul intekenare te ontleed. Miskien werk dit vir sommige, maar persoonlik dink ek dit is fundamenteel verkeerd. Hoekom?

Jou laaiks word versamel en ontleed

Neem nou jou fone, kyk na jou topgroepe – daar sal beslis meer as 50% van groepe wees waarvan jy reeds vergeet het, dit is een of ander inhoud wat eintlik vir jou irrelevant is. Jy verbruik dit glad nie, maar nietemin sal die stelsel jou volgens hulle opspoor: dat jy ingeteken het op resepte, by sommige gewilde groepe. Dit wil sê, jy sal die stelsel wat jou profiel ontleed, oortree, en jou belange sal nie geregverdig word nie.

Beweeg aan... Wat is daar? Ons neem aan wat ander mense doen. Na ons mening is die mees geskikte manier om die belange van gebruikers te evalueer. Byvoorbeeld, op VKontakte is daar geen hou-voer nie, en mense dink dat niemand weet waarvan hulle hou nie. Ja, sommige van die likes word op Instagram bekendgestel, ons sien iets op Facebook, maar die meeste van die inhoud in sekere groepe saai dit nie in 'n algemene stroom uit nie, en mense leef en dink dat niemand sal weet waarvan hulle hou nie.

En deur sekere inhoud van een of ander aard te versamel wat ons interesseer, hierdie plasings te versamel, hierdie laaiks te versamel, dan hierdie persoon met behulp van hierdie databasis na te gaan, kan ons met hoë akkuraatheid bepaal wie hy is, wat sy lot is, waarin hy belangstel. Plaas hom presies in 'n sekere sosiale groep en kommunikeer met hom.

Om 'n motor te koop verander gedrag

Ek het so 'n voorbeeld. Ek sal dadelik 'n voorbehoud maak dat my voorbeelde naby-advertensies en naby-bemarking is, want, jy weet, die meeste gevalle word deur NDA beskerm, ensovoorts. Maar daar sal nog baie interessante dinge wees. So, die storie met hierdie mense: dit is mans wat tussen 2010 en 2015 'n motor gekoop het. Hoe hul aanlyn sosiale gedrag verander het, word deur kleur aangedui. Die persentasie meisies onder intekenare het verander, ek het ingeteken op "seunsagtige" publieke bladsye, 'n permanente seksmaat gevind ...

Arthur Khachuyan: "Regte groot data in advertensies"

Hierdie hele ding word volgens motormerk en aantal mense opgedeel. Van hier af kan jy baie interessante gevolgtrekkings maak oor mense se gedrag en hoe dit alles werk. Ek kan sê dat die Porsche Cayenne en die aangeplante Priora amper identies is wat die aantal gelokte gehore betref. Die kwaliteit van hierdie gehoor en hul gedrag verskil, maar die hoeveelheid is ongeveer dieselfde. Die gevolgtrekking wat jy van hier af kan maak, is wat jy ook al wil hê, nader aan jou mark. As jy 'n Audi verkoop, maak jy die slagspreuk "Koop 'n Audi en kom weg van jou ouers af!" en so aan.

Ja, dit is 'n snaakse voorbeeld van die feit dat die gedrag van mense gebaseer op die ontleding van houe, gebaseer op na watter groep hulle beweeg, watter inhoud hulle ontleed - met amper 100% waarskynlikheid maak dit duidelik wie jy is. Want as jy nie toegang tot netwerkverkeer het nie en nie persoonlike boodskappe lees nie, sal likes jou altyd vertel wie hierdie persoon is - 'n swanger vrou, 'n ma, 'n militêre man, 'n polisieman. En vir jou, as 'n persoon wat kan adverteer, is dit 'n groot treffer op die teiken.

Antwoorde op vrae uit die gehoor:

  • Elke kolom is die aantal mense in hierdie motor; hoe hul gedragspatrone verander het. Kyk: mense wat 'n Porsche Cayenne gekoop het - ongeveer 550 mense (geel), die persentasie meisies onder intekenare het toegeneem.
  • Die steekproef is gebruikers van sosiale netwerke "Vkontakte", "Facebook", "Instagram" van 2010 tot 2015. Die enigste verduideliking: die motors wat hier gekies word, is dié wat met meer as 80% akkuraatheid op foto's uitgeken kan word deur sekere gereedskap te gebruik.
  • Oor 'n sekere tydperk is sy motor (wel, dit wil sê nie syne nie, ons laat dit aan sosiale netwerke oor)... Oor 'n sekere tydperk is 'n persoon gedurig met die motor gefotografeer, was daarby, die publikasies was anders, die foto's was uit verskillende hoeke, ensovoorts. Daar sal dan 'n foto wees van watter mense foto's neem met watter motors en... Ja, dit is die tweede vraag - vertroue in sosiale netwerkdata.
  • Aangesien ons dit ter sprake gebring het, is sosiale media-data ongelukkig nie altyd korrek nie. Mense is nie altyd geneig om hul inligting te publiseer nie. Persoonlik het ek so 'n studie gedoen: ek het die aantal gegradueerdes van Moskou-universiteite vergelyk met die aantal mense wat op sosiale netwerke geregistreer is. Gemiddeld is 60% meer mense op sosiale netwerke geregistreer - gegradueerdes van die Moskou Staatsuniversiteit in 'n sekere jaar in sekere spesialiteite - as wat daar eintlik in beginsel is. So ja - daar is natuurlik 'n persentasie foute hier, en niemand steek dit weg nie. Hier neem ons bloot daardie motors wat met meer as 80% waarskynlikheid geïdentifiseer kan word as basis.

Lys van bronne vir modelopleiding

Hier is 'n voorbeeldlys van bronne wat gebruik kan word, wat gebruik word om met groot sekerheid die sosiale profiel van 'n persoon, wie hy is, te bepaal.

Arthur Khachuyan: "Regte groot data in advertensies"

Ons neem 'n profiel van sosiale netwerke, van CIAN - die koste van 'n woonstel is ongeveer, "Head-Hunter", "Superjob" - dit is die gemiddelde salaris vir 'n gegewe persoon. Ek hoop daar is geen Head Hunter-verteenwoordigers hier nie, want hulle dink dit is nie baie goed om hierdie data van hulle af te neem nie. Dit is egter die gemiddelde salaris in sekere streke vir sekere soorte aktiwiteite vir vakatures.

"Avito", "Avto.ru": baie dikwels het mense, wanneer hul foon verlig is, dit beslis (in 'n groot aantal gevalle) ten minste iets op "Avito", of op "Avto.ru", of op 'n ander verskeie webwerwe waaruit jy kan verstaan ​​wie hulle is. As 'n stootwaentjie of 'n motor op hierdie telefoonnommer verkoop is... Rosstat en die Unified State Register of Legal Entities is nog meer registers met behulp waarvan u die diensmaatskappy kan rangskik - volgens een of ander formule, volgens 'n model wat enige persoon kan stel (jy kan rofweg die geld van hierdie persoon bepaal ens.).

Tinder help om data oor mense se situasie in te samel

Boonop is daar so 'n interessante ding (alternatiewelik is dit baie snaaks in die studie) - dit is weer die versameling van data van Moskou Tinder wat bots vir hierdie Tinder gebruik. Die afstand na mense is bepaal, en dan is hul benaderde ligging bepaal.

Arthur Khachuyan: "Regte groot data in advertensies"

Die doel van hierdie studie was om die aantal Tinder-rekeninge op die grondgebied van staatsinstellings te bepaal – in die Doema, die aanklaer se kantoor, ensovoorts. Maar jy, as adverteerder, kan jou voorstel wat jy wil: dit kan byvoorbeeld Starbucks of iemand anders wees... Dit wil sê die aantal mense op Tinder wat koffie by jou drink, iets bestel, in winkels is Wat hierdie geoligging betref: dit kan met enige diens gedoen word.

Antwoord op 'n vraag uit die gehoor:

  • Tinder? Jy weet nie? Tinder is 'n afspraaktoepassing waar jy deur foto's kyk (links-regs), en hierdie toepassing wys vir jou die afstand na die persoon. As jy die afstand na hierdie persoon vanaf drie verskillende punte kry, kan jy ongeveer (+ 5-7 meter) die ligging bepaal. In hierdie geval, vir bepaling op die grondgebied van die aanklaer se kantoor of die Doema, is dit nie so moeilik nie. Maar weereens, dit kan jou winkel wees, dit kan enigiets wees.

Byvoorbeeld, 'n lang, lang tyd gelede het ons so 'n geval gehad (nie 'n studie nie), toe ons van een van die sellulêre operateurs data ontvang het oor verkeersdigtheid, data oor die bewegingsdigtheid van sellulêre punte, en al hierdie inligting is op mekaar geplaas. op die koördinate van advertensieborde wat op hoofweë geleë is. En die taak van die sellulêre operateur is om ongeveer te bepaal hoeveel mense daar verbygaan en moontlik hierdie advertensiebord kan sien.

As daar reklamebord-advertensiespesialiste hier is, kan jy sê: dit is onmoontlik om met superbetroubaarheid te verstaan ​​- iemand kom, iemand het nie gekyk nie, iemand het gekyk ... Nietemin is dit 'n voorbeeld van hoe daar 20 biljoen veelhoeke van hierdie in Moskou, waarop die digtheid van hierdie mense elke uur langs sekere roetes is... Jy kan enige oomblik sien waarby hierdie mense verby gegaan het en die passasiersvloei rofweg skat.

Antwoord op 'n vraag uit die gehoor:

  • Niemand gee sulke data nie. Ons het so 'n studie vir een van die operateurs gedoen; dit is 'n eksklusiewe interne storie, so dit word ongelukkig nie in die vorm van prente aangebied nie. Maar dikwels het groot reklame-agentskappe geen probleme om 'n operateur te kontak nie. Ten minste in Moskou is daar baie presedente wanneer, byvoorbeeld, versekeringsmaatskappye hulle wend tot maatskappye soos GetTaxi, wat onpersoonlike inligting verskaf oor die ouderdom van die bestuurder, hoe hulle bestuur (goed - sleg, roekeloos - nee), om te voorspel beleide en so meer. Almal sukkel hiermee, maar op een of ander interne vlak, gee anonieme data - ek dink niemand het so 'n probleem nie.

Beeld- en patroonherkenning

Gaan voort. My gunsteling is beeldherkenning. Daar sal 'n klein stukkie wees oor soek na mense deur gesigte, maar ons neem meestal nie hierdie deel nie. Ons neem spesifiek beeldherkenning en bepaal wat in hierdie beeld is - die fabrikaat van die motor, sy kleur, ensovoorts.

Arthur Khachuyan: "Regte groot data in advertensies"

Ek het hierdie snaakse voorbeeld:

Arthur Khachuyan: "Regte groot data in advertensies"

Daar was so 'n studie oor die soeke na tatoeëermerke op verskeie sosiale netwerke. Gevolglik kan dieselfde toegepas word op enige handelsmerk, op enige visuele beeld, op byna enige visuele beeld. Daar is diegene wat nie betroubaar bepaal kan word nie (ons neem hulle nie).

Arthur Khachuyan: "Regte groot data in advertensies"

Hier is my gunsteling. Motorhandelsmerke wend hulle dikwels tot hierdie taak omdat hul taak byvoorbeeld is om al die eienaars van een of ander BMW X6 te vind, te verstaan ​​wie hulle is, hoe hulle met mekaar verbind is, waarin hulle belangstel, ensovoorts. Dit hou verband met die vraag met watter motors mense foto's neem op sosiale netwerke.

Arthur Khachuyan: "Regte groot data in advertensies"

Hier was glad nie gefiltreer nie: die voorwerp was hulle s'n, die kar was nie hulle s'n nie; Dit is net die afbreek van motors - ouderdom en so aan. Maar visuele beeldherkenning word redelik gereeld gebruik: dit is die soektog na swanger vroue, en die soektog na handelsmerklogo's in 'n soort massamedia (wie plaas wat).

Arthur Khachuyan: "Regte groot data in advertensies"

My gunsteling geval (wat deur verskeie restaurante gebruik word): watter soort rolle word op 'n sosiale netwerk geplaas. Dit is 'n snaakse ding, maar in werklikheid laat dit jou toe om baie interessante dinge te verstaan, eerstens oor jou eie kliënte: wie na jou toe gekom het en hoekom hulle dit gedoen het. Want dit is geen geheim dat in soesji-kroeë die meeste mense (ek sal nie "meisies" sê nie) foto's neem om in te meld, 'n foto van iets te neem, ens.

Die handelsmerk kan hieruit voordeel trek. Die handelsmerk stel belang in watter soort produkte dit nodig het om mooi te fotografeer en te plaas, watter soort mense daar gekom het. Hierdie ding kan gedoen word met byna enigiets, van kos.

Videopatroonherkenning

Antwoord op 'n vraag uit die gehoor:

  • Nie op video nie. Ons het dit in toetsmodus. Ons het hierdie tegnologie probeer, maar dit blyk dat ... Dit herken alles met video redelik goed, maar ons het nêrens 'n toepassing daarvoor gevind nie. Totsiens. Behalwe om te ontleed hoeveel en watter videobloggers iewers praat... Daar was so 'n studie. Hoeveel van hul gesigte ontmoet, hoe gereeld. Maar handelsmerke het nog nie uitgepluis waar om hiermee vorendag te kom nie. Miskien sal dit eendag kom.

Weereens, dit is kos, dit kan swanger vroue, mans (nie swanger nie), motors wees - enigiets.

As 'n opsie was daar 'n Nuwejaarstudie vir een media. Ook ver van adverteer, maar tog. Dit is watter soort kos mense vir die Nuwejaar gevas het:

Arthur Khachuyan: "Regte groot data in advertensies"

Dit word ook hier volgens ouderdom afgebreek. Jy kan so 'n korrelasie sien dat jongmense meestal kos bestel, volwassenes meestal 'n tradisionele tafel maak. Dit is 'n snaakse ding, maar as jy dit as 'n handelsmerkeienaar voorstel, kan jy 'n groot aantal dinge evalueer: wie jou produk hanteer en hoe, wat hulle daaroor skryf. Dikwels noem mense nie altyd die handelsmerk self in die teks nie, en tradisionele analitiese moniteringstelsels kan nie altyd hierdie melding van die handelsmerk verstaan ​​en vind uitsluitlik omdat dit nie in die teks genoem word nie. Of die teks is verkeerd gespel, daar is geen hash tags of iets nie.

Die foto's is sigbaar. Met fotografie kan jy sien of dit die middelste onderwerp van die raam is of nie die middelste onderwerp van die raam nie. Dan kan jy sien wat hierdie persoon geskryf het. Maar meestal word dit gebruik as 'n soektog na potensiële gehore wat sekere motors bestuur het, ensovoorts. En dan sal ons baie interessante dinge met hierdie motors doen.

Bots word geleer om mense na te boots

Daar was ook so 'n opsie om mensetelling te gebruik:

Arthur Khachuyan: "Regte groot data in advertensies"

Daar is 'n opsie om mense te vergelyk, wanneer jy mense moet vind wat sommige foto's gebruik, hul sosiale profiel moet verstaan, wie hulle is. Weereens, ons keer terug na die vraag dat as ons 'n kamera in 'n vanlyn winkel het, dit 'n redelike goeie manier is om te verstaan ​​wie na jou toe kom, wie hierdie mense is, waarin hulle belangstel, wat hulle aangespoor het om na jou toe te kom .

Volgende kom die interessantste ding: as ons hul rekeninge op sosiale netwerke versamel, verstaan ​​wie hierdie mense is, waarin hulle belangstel, kan ons (as 'n opsie) 'n bot maak wat soortgelyk is aan hierdie mense; hierdie bot sal soos hierdie mense begin leef en analiseer watter advertensies dit op verskeie sosiale netwerke sien. Dit sal jou toelaat om akkuraat te verstaan ​​watter handelsmerke op hierdie persoon gerig is. Dit is ook 'n redelik algemene storie wanneer jy nie net moet ontleed wie hierdie persoon is en watter belangstellings hy het nie, maar ook watter soort advertensie jou potensiële mededingers of ander belangstellendes moet teiken.

Arthur Khachuyan: "Regte groot data in advertensies"

Ontleding van verbindings in sosiale netwerke

Arthur Khachuyan: "Regte groot data in advertensies"

Die volgende interessante ding is die ontleding van verhoudings tussen mense. Eintlik, die ontleding van verbindings in die netwerk, hierdie netwerk grafieke - daar is nie 'n bietjie, niks nuuts in hierdie, almal weet dit.

Arthur Khachuyan: "Regte groot data in advertensies"

Maar die toepassing op advertensietake is die interessantste. Dit is 'n soektog na mense wat neigings stel, dit is 'n soektog na mense wat inligting volgens sekere kriteria binne hierdie netwerk versprei. Kom ons sê ons stel belang in dieselfde eienaars van 'n sekere BMW-model. Deur hulle almal bymekaar te bring, kan ons diegene vind wat die openbare mening beheer. Dit is nie noodwendig motorbloggers en so aan nie. Gewoonlik is dit eenvoudige kamerade wat op verskeie openbare blaaie sit, belangstel in sekere inhoud en in 'n baie kort tydperk jou handelsmerk of iemand wat vir jou belangstel na hierdie verantwoordelikheidsgebied, na die gebied van belangstelling.

Daar is so 'n voorbeeld hier. Ons het 'n paar potensiële mense, verbindings tussen mense. Hier is die oranje mense, die klein kolletjies is gemeenskaplike groepe, gemeenskaplike vriende.

Arthur Khachuyan: "Regte groot data in advertensies"

As jy al hierdie verbande tussen hulle versamel, kan jy baie duidelik sien dat daar mense is wat 'n groot aantal gemeenskaplike groepe het, gemeenskaplike vriende, hulle is daar onder mekaar ... En as hierdie selfde visualisering volgens belangstellings in groepe verdeel word, volgens inhoud, wat hulle versprei, hoeveel hulle met mekaar omgaan... Hier kan jy sien dat die vorige prentjie so geword het:

Arthur Khachuyan: "Regte groot data in advertensies"

Hier word die groepe duidelik deur kleur onderskei. In hierdie geval is dit ons meestersgraadstudente by die Hoër Skool vir Ekonomie. Hier kan jy sien dat die pers/blou diegene is wat lief is vir Transparency International, Open Russia en Khodorkovsky se publieke bladsye. Links onder is die groenes, diegene wat lief is vir United Russia.

Jy kan sien dat die vorige prentjie so was (dit is net verbande tussen mense), maar het duidelik afgebaken. Dit wil sê, alle mense is altyd met mekaar verbind, hulle het dieselfde belangstellings, hulle is vriende met mekaar. Daar is sommige bo, ander onder, en ander kamerade daar. En as elkeen van hierdie klein subgrafies afsonderlik met ander parameters gevisualiseer word en kyk na die spoed van inhoudverspreiding (rofweg gesproke, wie plaas wat daar weer), kan jy in elke deel een of twee mense vind wat altyd die openbare mening in hul hande hou, interaksie waarmee, vra stuur 'n soort post of iets anders - jy kan 'n reaksie van hierdie hele interessante gehoor kry.

Ek het nog so 'n voorbeeld. Ook 'n grafiek: dit is BBDO Groep-werknemers wat as voorbeeld op sosiale netwerke gevind word. Dit lyk oninteressant, groot, groen, verbindings tussen hulle ...

Arthur Khachuyan: "Regte groot data in advertensies"

Maar ek het 'n opsie waar groepe reeds tussen hulle gebou is. Dan, as iemand belangstel, is daar 'n interaktiewe weergawe - jy kan klik en kyk.

Regs bo is diegene wat Poetin liefhet. Hier is die pers die ontwerpers; diegene wat belangstel in ontwerp, iets interessants, ensovoorts. Hier is die wit goed die bestuurspan (blykbaar, soos ek verstaan); Dit is mense wat oor die algemeen nie op enige manier verbind is nie, maar in ongeveer dieselfde posisies werk. Die res is hul gemeenskaplike groepe, verbindings, ensovoorts.

Handelsmerke het nie bloggers nodig nie, maar meningsleiers

Ons vat hierdie mense en vind hulle – dan besluit die advertensie-agentskap, die advertensiemaatskappy self: dit kan geld aan hierdie persoon gee sodat hy op een of ander manier met hierdie inhoud, iets anders interaksie het, of sy eie spesifieke advertensieveldtog na hulle rig. Dit word ook baie gereeld gebruik, veral nou, want alle handelsmerke wil met bloggers werk, hulle wil hê hul inhoud moet bevorder word, maar advertensie-agentskappe wil nie regtig kontak nie (wel, dit gebeur).

En die regte uitweg uit hierdie situasie is om mense te vind wat nie bloggers is nie, nie skoonheidsbloggers nie, maar byvoorbeeld 'n paar regte wesens wat interaksie het met hierdie handelsmerk, wat in die een of ander ellendige publieke bladsy "Mail.ru Answers" kan skryf, kry 'n sekere aantal kyke. Hierdie mense, wat voortdurend in hierdie persoon se inhoud belangstel, sal die hele ding versprei, en die handelsmerk sal sy betrokkenheid kry.

Die tweede opsie vir die gebruik van sulke tegnologie nou is redelik relevant - soek na bots, my gunsteling. Dit is 'n reputasierisiko vir jou mededingers, en 'n geleentheid om irrelevante mense uit 'n advertensieveldtog en enigiets anders te verwyder (opmerkings uitvee en na verbindings tussen mense soek). Ek het so 'n voorbeeld, dit is ook groot en interaktief - jy kan dit skuif. Dit is verbindings van mense wat kommentaar in die Lentach-gemeenskap geskryf het.

Hierdie voorbeeld is sodat jy verstaan ​​hoe goed en maklik sigbare bots is; en hiervoor hoef jy geen tegniese kennis te hê nie. Dit beteken dat "Lentach" 'n plasing gepubliseer het oor die FBK-ondersoek oor Dmitri Medwedef, en sekere mense het kommentaar begin skryf. Ons het al die mense wat kommentaar geskryf het versamel - hierdie mense is groen. Nou sal ek dit skuif:

Arthur Khachuyan: "Regte groot data in advertensies"

Die mense is die groenes (wat die kommentaar geskryf het). Hulle is hier, hulle is hier. Die blou kolletjies tussen hulle is hul algemene groepe, die geel kolletjies is hul algemene intekenare, vriende, ensovoorts. Die meeste mense is met mekaar verbind. Want, wat ook al die teorie van drie, vier, vyf handdrukke is, alle mense is op sosiale netwerke met mekaar verbind. Daar is geen mense wat van mekaar geskei is nie. Selfs my sosiaal-fobiese vriende wat VKontakte uitsluitlik gebruik om video's te kyk, is steeds ingeteken op sommige van dieselfde publieke bladsye as ons.

Navalny gebruik ook bots. Almal het bots

Die meeste mense (hier is dit, hier) is met mekaar verbind. Maar daar is so 'n klein groepie kamerade wat eksklusief met mekaar vriende is. Hier is hulle, die groentjies, hier is hulle gemeenskaplike vriende en groepe. Hulle het selfs hier apart geval:

Arthur Khachuyan: "Regte groot data in advertensies"

En deur 'n gelukkige toeval was dit juis hierdie mense wat onder hierdie pos geskryf het: "Navalny het geen bewyse nie" ensovoorts, en dieselfde kommentaar geskryf het. Natuurlik durf ek nie gevolgtrekkings maak nie. Maar nietemin, ek het nog 'n plasing op Facebook gehad, toe daar 'n debat tussen Lebedev en Navalny was, het ek die opmerkings op dieselfde manier ontleed: dit het geblyk dat al die mense wat geskryf het "Lebedev is kak", hulle was nie op sosiale media nie. netwerke het onlangs vier maande, nie ingeteken op enige van die publieke bladsye nie, skielik na hierdie spesifieke pos gegaan, hierdie presiese opmerking geskryf en verlaat. Weereens, dit is onmoontlik om van hier af gevolgtrekkings te maak, maar iemand van Navalny se span het vir my 'n opmerking geskryf dat hulle nie bots gebruik nie. Wel, oukei!

Nader aan advertensies, nader aan die handelsmerk. Almal het nou bots! Ons het hulle, ons mededingers het hulle, en ander het hulle. Hulle moet uitgegooi of gelos word om goed te lewe; Op grond van sulke data (wys na die vorige skyfie), bring hulle tot perfeksie sodat hulle soos regte mense lyk en gebruik dit dan eers. Alhoewel die gebruik van bots sleg is! Nietemin, 'n redelik algemene storie ...

In outomatiese modus laat so iets jou toe om mense wat irrelevant is vir die analise uit jou ontleding te filter, mense wat nie in die steekproef ingesluit behoort te word nie, moet nie by hierdie studie ingesluit word nie. Baie dikwels gebruik. Dan weer, nie alle motoreienaars besit eintlik motors nie. Soms stel mense net belang in mense wat moontlik 'n motor het, wat in sommige groepe sit, met iemand kommunikeer, hulle het 'n sekere gehoor daar.

Ontleding van feite en menings

Die volgende een wat ek het is ook my gunsteling. Dit is 'n ontleding van feite en opinies.

Arthur Khachuyan: "Regte groot data in advertensies"

Deesdae weet almal hoe om hul handelsmerk in verskeie bronne te noem. Daar is geen geheim hieraan nie. En dit lyk of almal tonaliteit kan bereken... Alhoewel ek persoonlik dink dat die tonaliteitsmetriek self nie baie interessant is nie, want as jy vir die kliënt kom sê: "Man, jy het 37% neutraal," en hy sê so. , "Sjoe! Koel!" Daarom sal dit interessanter wees om 'n bietjie verder te beweeg: van die beoordeling van sentiment tot die beoordeling van die menings van wat hulle oor jou produk sê.

En dit is ook 'n baie interessante ding, want... Ek glo persoonlik dat daar in beginsel geen neutrale boodskappe kan wees nie, want as 'n persoon iets in die openbare ruimte skryf, is hierdie boodskap op een of ander manier enigsins gekleur. Ek het persoonlik nog nooit 'n neutrale boodskap gesien wat 'n handelsmerk noem nie. Gewoonlik is dit 'n soort vuilheid.

As ons 'n groot aantal van hierdie boodskappe neem (daar kan miljoene, 10 miljoen wees), die hoofgedagte uit elke boodskap uitlig, dit kombineer, kan ons redelik betroubaar verstaan ​​wat mense oor hierdie handelsmerk sê, wat hulle dink. "Ek hou nie van die verpakking nie," "Ek hou nie van die konsekwentheid nie," ensovoorts.

Wat dink mense van Transaero, Chupa Chups en die president van die Verenigde State?

Ek het 'n snaakse voorbeeld: dit is 'n infografika oor wat sosiale netwerkgebruikers met die Transaero-maatskappy sou doen ná sy bankrotskap.

Arthur Khachuyan: "Regte groot data in advertensies"

Daar is baie interessante voorbeelde daar: brand, doodmaak, deporteer na Europa, daar was selfs 2% wat geskryf het - "Stuur hulle na Sirië vir militêre operasies." As jy voortgaan van die snaakse ding, kan dit amper enige handelsmerk wees - van my gunsteling hondekos tot sommige motors. Wie nie van die verpakking hou nie, wie nie van regte goed hou nie – jy kan altyd hiermee werk, jy kan dit altyd in ag neem. Daar is 'n groot aantal voorbeelde wanneer mense amper die produksie van hul produkte verander het omdat hulle op sosiale netwerke geskryf het dat Chupa Chups nie rond genoeg is nie of dit nie soet genoeg is nie.

Daar is nog 'n snaakse voorbeeld. Raai watter opmerkings en oor wie?

Arthur Khachuyan: "Regte groot data in advertensies"

Om een ​​of ander rede, nou word die ontleding van menings, die ontleding van feite wat uit boodskappe onttrek word, nie baie gebruik nie en is nie baie wydverspreid nie. Alhoewel hierdie tegnologie nie supergeheim is nie, is daar feitlik geen kennis hierin nie, want om die onderwerp, predikaat en groepering uit mense se kommentaar te onttrek, vereis nie 'n genie in rekenaarlinguistiek nie. Dit is nie so moeilik om te doen nie. Maar ek hoop dat mense in die volgende paar jaar dit sal begin gebruik, want... Dit sal gaaf wees - dit is sulke outomatiese terugvoer! Jy weet altyd wat hulle van jou sê. Wel, jy verstaan ​​dat dit oor die Amerikaanse president gemaak is.

Antwoord op 'n vraag uit die gehoor:

  • Ja, dit is Facebook in Engels. Hulle word hier in Russies vertaal. Dit is iewers geskryf.

Groot data en politieke tegnologieë

Trouens, ek het baie verskillende interessante voorbeelde van politiek oor Trump en almal anders, maar ons het besluit om dit nie hierheen te bring nie. Maar daar is een politieke voorbeeld.

Dit is verkiesings tot die Doema. Wanneer was jy? Laas jaar? Amper 'n jaar en 'n half gelede.

Arthur Khachuyan: "Regte groot data in advertensies"

Hier is mense wat hul presiese ligging kon bepaal, tot by 'n sekere geopunt, om te verstaan ​​in watter verkiesingsgebied hulle val. En dan is van hierdie mense net diegene geneem wat hul besliste mening uitgespreek het, vir wie hulle sou stem.

Uit die oogpunt van politieke tegnologie is dit nie baie korrek nie, want hierdie hele ding moet genormaliseer word deur bevolkingsdigtheid ensovoorts. Nietemin, die bloues hier gaan vir julle stem weet jy wie, die rooies gaan stem vir opposisie comrades, van wie daar terloops nie baie was nie.

Ek glo persoonlik dat Big Data nie binnekort politieke tegnologieë sal bereik nie, maar as 'n opsie is die kandidaat ook 'n handelsmerk. En dit is ook, tot 'n mate, 'n ontleding van feite en menings oor jou handelsmerk, en 'n nogal interessante ding, want jy kan intyds verstaan ​​wie wat doen. Ek ken verskeie gevalle van die BBC, toe hulle sosiale netwerke intyds gemonitor het in een of ander uitsending: daar was so en so 'n reaksie, mense skryf daaroor, vra so en so 'n vraag - en dit is wonderlik! Ek dink dit sal binnekort gebruik word, want dit is vir almal interessant.

Modelleer handelsmerkposisies

Arthur Khachuyan: "Regte groot data in advertensies"

Volgende het ek modellering van handelsmerkposisies. Hierdie is 'n klein, kort stukkie oor hoe jy handelsmerke kan rangskik deur verskeie maatstawwe te gebruik (nie hou van intekenare op sosiale netwerke nie, maar deur komplekse maatstawwe te gebruik, belangstelling in inhoud, tyd wat spandeer word om maatstawwe te ontvang).

Arthur Khachuyan: "Regte groot data in advertensies"

Ek het 'n voorbeeld van "pharma" om 'n sekere rede. Hier is die klein sirkels intern, helder - dit is die hoeveelheid teksinhoud wat die handelsmerk self skep, die groot sirkel is die hoeveelheid foto- en video-inhoud wat die handelsmerk self skep.

Nabyheid aan die sentrum wys hoe interessant die inhoud vir die gehoor is. Daar is 'n groot model, daar is 'n klomp allerhande parameters: hou van, herplasings, reaksietyd, wie het gemiddeld daar gedeel... Hier kan jy sien: daar is 'n wonderlike "Kagotsel", wat 'n groot hoeveelheid van pomp geld om sy eie inhoud te skep, en as gevolg hiervan is hulle redelik naby aan die sentrum. En daar is kamerade wat ook hul eie inhoud skep, maar die gehoor stel nie daarin belang nie. Dit is nie 'n baie voldoende voorbeeld nie, want al hierdie rekeninge is feitlik dood.

Yegor Creed is meer geliefd as Basta

Arthur Khachuyan: "Regte groot data in advertensies"

Ongelukkig, die res ... van wat om te wys ... Wel, daar is ook Russiese rappers, as 'n opsie, van regte maatskappye.

Wat is die pluspunt? Die feit is dat 'n maatskappy feitlik enigiets in so 'n model kan sit, vanaf die gemiddelde salaris van intekenare wat vir jou handelsmerk werk; enige model waarvan hulle hou. Omdat elke advertensie-agentskap sy eie maatstawwe anders bereken, bereken handelsmerke hul eie maatstawwe anders.

Hier is ook een - Basta, wat 'n groot hoeveelheid inhoud genereer, maar op die periferie geleë is, want hierdie inhoud is blykbaar nie baie interessant vir die gehoor nie. Weereens, ek vermetel nie om te oordeel nie. Maar nietemin is daar Yegor Creed, wat volgens sosiale netwerke amper die beste presteerder van ons tyd is, maar net sy persoonlike foto's publiseer. Hy het nietemin 'n groot aantal intekenare: daar is iewers rondom 'n miljoen van hulle. Ek onthou nie die presiese nommer nie; Ek onthou dat die persentasie van betrokkenheid van hierdie mense baie hoër as 85% is, dit wil sê, per miljoen intekenare ontvang hy 850 duisend antwoorde van hierdie regte mense - dit is ware waansin. Dit is waar.

Arthur Khachuyan: "Regte groot data in advertensies"

Antwoorde op vrae uit die gehoor:

Hoe lank het dit geneem om die rapper-ontledingsmodel te skep?

  • Elkeen het sy eie teikengehoor, die belange van hierdie mense word vir elkeen bereken... Dit alles word genormaliseer tot die afstand na die middel ongeveer, hul radiale posisie is nie belangrik nie (dit word bloot hier gesmeer vir skoonheid, sodat hulle dit doen mekaar nie raakloop nie). Slegs die benaderde nabyheid aan die sentrum is belangrik. Dit is die model wat ons gebruik. Ek hou byvoorbeeld beter van die sirkel, sommige mense doen dit in gedagte as 'n halfsirkel.
  • Hierdie model is vinnig saamgestel, in twee of drie uur (ja, een persoon). Hier is slegs metrieke ingevoeg: wat ons vermenigvuldig met wat, tel dit op en normaliseer dit dan op een of ander manier. Hang af van die model. Daar is mense wat belangstel in die gemiddelde salaris (dit is nie 'n grap nie) van hul intekenare. En hiervoor moet jy hul kontakte, Avito, vind, dit alles bereken, dit vermenigvuldig. Dit gebeur dat dit lank neem om in ag te neem, maar spesifiek dit (wys na die vorige skyfie) - die parameters hier is baie eenvoudig: intekenare, herplasings, ensovoorts. Dit het ongeveer twee tot drie uur geneem om te voltooi. Gevolglik word hierdie ding dan intyds opgedateer, en jy kan dit gebruik.

Nou kom die prettige deel. Ek is klaar met voorbeelde, want dit is nie interessant om lank alleen te praat nie. En ek hoop dat jy nou vrae sal vra, en ons sal in werklikheid van onderwerp tot onderwerp beweeg, want ek het sulke voorbeelde van hoe tegnologie gebruik kan word ensovoorts...

Antwoorde op vrae uit die gehoor:

  • Ek het een en enigste persoonlike saak gehad met een, so te sê, "naby-casino", wanneer 'n kamera daar geplaas is, gesigte herken is, ens. Die persentasie mense wat erken word, is beslis redelik groot - ons s'n sowel as ons mededingers. Maar dit is eintlik nogal interessant. Ek sien dit as 'n interessante ding: jy kan verstaan ​​wie hierdie mense is en redelik goed voorspel hoekom hulle presies hierheen gekom het, wat in hul lewens so verander het dat hulle besluit het om na die casino te kom. Maar wat spesifieke soorte besigheid betref ... As jy so iets in 'n apteek sit, dan is daar geen punt nie - jy kan nie voorspel hoekom 'n persoon na die apteek gekom het nie.

    Die globale taak hier was om 'n model te bou om te verstaan ​​wanneer 'n persoon moontlik in jou handelsmerk wil belangstel, sodat jy vir hom advertensies kan gee nie nadat hy iets gekoop het nie (soos nou gebeur nie), maar vir hom advertensies gee " in voorspelling” van wanneer dit alles sal gebeur. Dit was interessant met so 'n "naby-casino"; daar blyk nogal 'n interessante persentasie van hierdie mense te wees - hoekom: iemand het skielik 'n bevordering gekry, iemand anders het iets anders gekry - sulke interessante insigte. Maar met sommige winkels, met kleinhandel, met 'n winkel van een of ander soort pille, lyk dit vir my of dit nie baie korrek sal wees nie.

Word Big Data vanlyn gebruik?

  • Dit was vanlyn. Jy moet net presies verstaan ​​of hierdie model sal pas of nie. Weereens, met vonkelwater... Ek stel eintlik in alles belang, maar ek verstaan ​​persoonlik nie hoeveel, hoe die profiele van hierdie mense, hul gedrag kan afhang van wanneer hulle gebottelde water wil koop nie. Alhoewel dit regtig waar kan wees, weet ek nie.

Hoeveel oop sosiale media-rekeninge is daar?

  • Ons het spesifiek 11 sosiale netwerke - dit is "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagram" en 'n paar klein dingetjies (ek kan na die lys kyk, soos "Mail.ru" ensovoorts) . Op VKontakte het ons beslis 'n kopie van al hierdie kamerade. Ons het mense op VKontakte - dit is 430 miljoen van almal wat al ooit bestaan ​​het (waarvan ongeveer 200 miljoen voortdurend aktief is); daar is groepe, daar is verbande tussen hierdie mense en daar is inhoud wat ons interesseer (teks), en 'n deel van die media, maar baie klein... Rofweg gesproke kyk ons ​​na hierdie prentjie: as daar gesigte daar is, is ons red hulle, as daar 'n meme is, red ons hulle Ons stoor dit nie, want selfs ons sou nie genoeg hê om die media-inhoud te stoor nie.

    Daar is 'n Russiese taal Facebook. Iewers is nou 60-80% Odnoklassniki, oor 'n paar maande sal ons hulle waarskynlik almal tot die einde toe kry. Russiese Instagram. Vir al hierdie sosiale netwerke is daar groepe, mense, verbindings tussen hulle en teks.

  • Sowat 400 miljoen mense. Daar is 'n subtiliteit: daar is mense wie se stad nie gespesifiseer is nie (hulle is potensieel Russies / nie-Russies); Hiervan is die gemiddelde vir sosiale netwerke 14% van geslote rekeninge op VKontakte, ek weet nie die presiese syfer op Facebook nie.
  • Ons stoor ook nie media op Instagram nie - net as daar gesigte daar is. Ons stoor nie sulke (ander) media-inhoud nie. Gewoonlik interessant: slegs teks, verbindings tussen mense; Almal. Die mees algemene navorsing op Instagram is die gewone navorsing oor die gehoor: wie hierdie mense is, en, bowenal, die verbinding van hierdie mense met ander sosiale netwerke. Vind hierdie persoon se profiel op Vkontakte en Facebook om sy ouderdom en so aan te bereken.
  • Dit is nie nodig om nog almal aan te vat nie – bloot omdat daar geen klante is nie. Wat die taal betref: ons het Russies, Engels, Spaans, maar dit word steeds uitsluitlik vir handelsmerke uit Rusland gebruik; wel, of die maatskappye wat hulle van Rusland af bring.
  • Ons ondervra mense elke dag in baie, baie, baie drade: ons samel data in deur die web te versamel, en werk hierdie aanwysers op met behulp van Api. In 2-3 dae kan jy deur die hele "VKontakte" gaan, deur hulle te gaan; Oor ongeveer 'n week kan jy deur die hele Facebook gaan en verstaan ​​wie wat opgedateer het en wat nie. En dan weer hierdie mense afsonderlik bymekaar: wat presies het verander, skryf hierdie hele storie neer. Baie selde in my ervaring is iemand se ou sosiale media-profiel vir enige werklike besigheidsdoel gebruik. Dit was die tyd toe een politieke figuur aansoek gedoen het, en sy taak was om te verstaan ​​watter soort mense na die hoofkwartiere kom, wie hierdie mense 6-8 maande gelede was (het hulle hul profiel uitgevee, maar eintlik vir 'n ander kandidaat, stembriewe aangekom bederf).

    En 'n paar keer - persoonlike stories wanneer iemand se foto's in die publieke domein gepubliseer is. Dit was nodig om verbande te vind, ens. Ongelukkig is dit jammer, maar ons kan nie in die hof getuig nie, want ons databasis is wetlik illikied.

  • MongoDB-berging is my gunsteling.

Sosiale netwerke probeer data-insameling beveg

  • Gewoonlik laai ons slegs 'n lys van hierdie rekeninge na adverteerders op, en dan gebruik hulle die standaard een ... Dit wil sê, op sosiale netwerke, op VKontakte, kan jy 'n lys van hierdie mense spesifiseer.

    Maar Facebook gebruik gekoopte koekies. Ons self werk nie met koekies nie, maar daar was verskeie stories toe die adverteerder self vir 'n paar mense gegee het, ons het met hulle in kontak gekom - hulle het hierdie netwerke, met teaser, nie-teaser-advertensies, hierdie "koekies". Jy kan dit vasmaak - geen twyfel nie! Maar ek hou nie regtig van hierdie goed nie, want ek dink nie dit is baie outentiek nie. Dit is suiwer na my mening, dit is soos TNS, wat TV's "track" - dit is nie duidelik of jy hierdie TV kyk of nie, of jy skottelgoed was terwyl jou TV aan is... En dit is dieselfde hier : Ek google baie gereeld iets op die internet, maar dit beteken nie dat ek dit wil koop nie.

  • As jy 'n soort standaard kontekstuele advertensienetwerk gebruik: Ek het verskeie stories gehad toe ons hierdie mense by hulle afgelaai het en probeer het om hulle met behulp van hul koppelvlakke met "koekies" op hul werwe te verbind. Maar ek hou nie regtig van sulke goed nie.

Formule vir die berekening van die salaris van 'n internetgebruiker

  • Die algemene formule vir die gemiddelde salaris: dit is die streek waar 'n persoon woon, dit is die kategorie besigheid waarin hy werk (dit is die maatskappy wat sy werkgewer is), dan word sy posisie in hierdie maatskappy geneem, die gemiddelde salaris vir hierdie pos word beraam... Gemiddelde salaris geneem uit "Head Hunter" en "Superjob" (en daar is verskeie ander bronne) vir 'n gegewe vakature in 'n gegewe streek en vir 'n gegewe besigheidskonteks.

    Van "Avito" en "Avto.ru" word bykomende parameters gewoonlik geneem as 'n persoon die telefoon verlig het. Met Avito kan jy sien watter soort goed 'n persoon verkoop - duur, goedkoop, gebruik, nie gebruik nie. Met "Avto.ru" kan jy sien of hy 'n motor het - hy besit dit, hy besit dit nie. Dit is iewers minder as 20% van mense wat per ongeluk hul foon iewers laat val het, en hul rekening kan met hierdie data gekoppel word.

Watter volumes werk die data-insamelingsmaatskappy?

  • Die volume gestoorde foto's in petagrepe is 6,4. Ek kan nie nou presies sê wat die groeikoers is nie, want in 2016 het ons begin om "periskope" op te neem en net begin om video op te neem.

    Ek kan nie presies sê wanneer dit nul was nie. Ons het van maatskappy tot maatskappy beweeg – dit is alles lang stories. Maar ek kan sê dat VK, Facebook, Instagram en Twitter - al hierdie besigheid (mense, groepe en verbindings tussen hulle) met teks en inhoud - dit is eintlik nie baie data nie, dit is onwaarskynlik dat selfs 'n petagreep genoeg het. Ek dink dit is 700 gigagrepe, waarskynlik 800.

Help jy kliënte om die huidige nis te bepaal en waar om te grawe?

  • Wanneer 'n kliënt kom, stel ons sulke goed vir hom voor, maar ons self doen nie sulke goed soos Google Trends nie.
  • Ons het verskeie byna sosiologiese stories gehad, met verkiesingsgeskiedenis, voorverkiesingsgeskiedenis - ons het dit alles ontleed. Met handelsmerke en die beoordeling van menings oor handelsmerke stem alles byna altyd ooreen. Hier is verkiesings-verkiesingsstories - nee (met 'n beoordeling van watter kandidaat moet wen). Ek weet nie wie hier verkeerd is nie - ons, of diegene wat in VTsIOM dink.
  • Gewoonlik neem ons hierdie beheerresultate van die handelsmerk self, hulle neem dit van kamerade wat navorsing bestel – telefoniese navorsing, bemarkingsnavorsing, ensovoorts. Boonop kan hierdie hele ding nagegaan word met basiese dinge: iemand het die poslys beantwoord, iemand het opnames gedoen ... As dit 'n groot handelsmerk is (byvoorbeeld Coca-Cola), het hulle beslis 'n miljoen of twee interne resensies van kliënte – dit is nie net kommentaar op sosiale netwerke en sommige menings nie; Dit is 'n soort interne stelsels, resensies, ensovoorts.

Die wet “weet” nie wat persoonlike data is nie!

  • Ons ontleed uitsluitlik oop databronne en raak nooit by enige vuil truuks betrokke nie. Ons model is gebou op die feit dat ons alle oop data in sommige openbare datasentrums stoor, dit iewers anders verhuur en dit by die huis, by ons kantore, in ons bedieners ontleed, en dit gaan nêrens buite die gebied nie.

    Maar ons wetgewing op die gebied van oop data is baie vaag.

    Ons het nie 'n duidelike begrip van wat oop data is, wat persoonlike data is nie - daar is hierdie 152ste federale wet, maar tog ... Hoe tel hulle? Nou, as ek jou naam en jou telefoonnommer in een databasis het, in 'n ander databasis het ek jou telefoonnommer en jou e-pos, in 'n derde het ek byvoorbeeld jou e-pos en jou kar; Dit alles blyk nie-persoonlike data te wees. As jy dit alles saamvoeg, blyk dit dat dit volgens die wet persoonlike data sal word.

    Ons kom op twee maniere om dit. Die eerste is om 'n bediener met sagteware vir die kliënt te installeer, en dan gaan hierdie data nie verder as sy gebied nie, en dan is die kliënt verantwoordelik vir die verspreiding van hierdie persoonlike data, nie-persoonlike data, ensovoorts. Of die tweede opsie: as dit 'n soort storie is waar jy 'n sosiale netwerk of iets anders moet dagvaar...

    Ons het so 'n studie gehad toe ons (daar was United Russia-primêrs) vir Lifenews die rekeninge van hierdie kamerade ingesamel en gekyk het van watter soort pornografie hulle hou. Dit was 'n snaakse ding, maar tog. Ons verkoop dit as ons eie, persoonlike mening, sonder om wettiglik in die dokumente bekend te maak wat ons ontleed het - die Unified State Register of Legal Entities, salarisse, sosiale netwerke; Ons verkoop deskundige mening, en dan op die kantlyn verduidelik ons ​​aan die persoon wat ons ontleed het en hoe.
    Daar was verskeie stories, maar hulle was verwant aan sommige openbare kommersiële projekte. Ons het byvoorbeeld 'n gratis nie-winsgewende projek vir diegene wat langplanke ry (sulke borde is lank): die taak was om mense se publikasies in te samel - wanneer iemand plaas "Ek het Gorky Park toe gegaan vir 'n rit." En nou behoort hy op die kaart te kom, en mense om hom kan sien dat iemand naby hom is. VK het vir 'n baie lang tyd koppe met ons oor hierdie onderwerp gestamp, want hulle het nie daarvan gehou dat ons hierdie inligting sonder mense se toestemming publiseer nie. Maar toe kom die saak nie in die hof nie, want binne verskeie groot gemeenskappe het ons by die reëls gevoeg dat die data deur derde partye, agentskappe, maatskappye, ontledings, ens gebruik kan word. Natuurlik was dit nie besonder eties nie, maar tog.

  • Ons het dit net betyds besef en ons kundige mening aan almal begin verkoop.

Werk jy met opvoedkundige instellings?

  • Ons werk saam met opvoedkundige instellings, ja. Ons het 'n hele reeks: ons het 'n meestersgraadprogram by die Hoërskool, en ons werk saam met ander universiteite. Ons is baie lief vir universiteite!
  • As jy my kontakte het, kan jy vir my skryf. En 'n skakel na die aanbieding, as iemand belangstel - al hierdie voorbeelde is daar, jy kan dit skuif.
  • As jy die telefoonnommer ken, pos - dit is amper 'n honderd persent opsie, niemand sal dit verwyder nie. As daar geen telefoonnommer is nie, is dit gewoonlik 'n foto; as daar geen foto is nie, is dit die jaar, woonplek, werk. Dit wil sê, volgens jaar, woonplek en werk kan byna almal altyd redelik subtiel geïdentifiseer word. Maar dit is weer 'n vraag oor die taak.

    Ons het byvoorbeeld 'n kliënt wat internettelevisie verkoop. Iemand het 'n intekening op hierdie "Games of Thrones" by hulle gekoop, en die taak is om hul CRM te gebruik om hierdie mense op sosiale netwerke te vind, en dan potensiële mense uit hul gebied van invloed te vind. Ek bedoel net dat hulle, sê maar, ’n voornaam, van en e-pos het... En dan is dit baie moeilik om iets te doen. In die meeste gevalle kan mense per e-pos gevind word.

  • Op grond van die samestelling van ons vriende "pas" ons gewoonlik mense op sosiale netwerke, maar dit is nie altyd korrek nie. Dit is nie dat dit nie altyd reg is nie – dit werk nie altyd nie. Eerstens verg dit baie arbeid, want hierdie operasie (pasmense) sal eers vir elkeen van die vriende uitgevoer moet word - om te verstaan ​​of hulle van sosiale netwerke af kom of nie. En dan - 'n onbekende feit vir almal dat ons op VKontakte dieselfde vriende het, op Facebook het ons verskillende vriende. Nie vir almal nie, maar vir my is dit byvoorbeeld so; en dit is ook waar vir die meeste mense.

Hoe word die mees volledige data ingesamel?

  • Die installering van sagteware vir die kliënt aan sy kant. 'n Bediener is op hulle geïnstalleer, wat slegs publieke data van ons neem en hul persoonlike data intern verwerk. 'n NDA word met die kliënt gesluit. Dit is natuurlik nie baie korrek dat hulle dit aan ons oordra nie, maar wetlike verantwoordelikheid berus by die kliënt – wel, dit wil sê om sagteware vir hom te installeer, of anonieme data oor te dra. Maar dit was baie skaars, want - korrekte of verkeerde anonimisering - in die meeste gevalle gaan die afhanklikheid tussen hierdie mense verlore.

Wie koop sagteware vir gesigsherkenning?

  • Ons gaan eintlik hierheen omdat ons hoofsagteware wat ons verkoop gesigsoektogte, korrelasie-analise is, en ons verkoop dit aan regeringsagentskappe. En 'n jaar en 'n half gelede het ons besluit dat ons al hierdie stories in advertensies, in bemarking, in die openbare mark sal sit - dit is hoe Social Data Hub, 'n kommersiële regsentiteit, gevorm is. En nou kom ons net hierheen. Ons kuier nou al 'n jaar en 'n half hier en probeer vir mense verduidelik dat dit nie nodig is om mense aflaaie te gee met 'n vermelding nie, dat hulle antwoorde op vrae gegee moet word, dat daar geen behoefte aan tonaliteit is nie. , en so aan. Dit is dus moeilik om te sê waar...
  • (Wie bedoel jy?) Aan alle kamerade wat terroriste en pedofiele moet soek.
    Ek kan dadelik sê (dit sal die volgende vraag wees): volgens ons data is geen onderwysers gevange geneem vir herplasing nie.
  • Op VKontakte - 14%; op Facebook is daar geen geslote profiel as sodanig nie (daar is 'n geslote lys vriende, ensovoorts). En die interessantste is dat ek sopas 'n boodskap geskryf het - nou sal hulle tel en sê.

Moenie iets plaas waaroor jy jou sal skaam nie!

  • Moenie iets op sosiale netwerke plaas wat jou sal skaam nie – ek persoonlik volg dit. Alhoewel ek baie persoonlike gehad het, want ek vloek op Facebook. Wel, daar was en daar was iets om te doen ... Moenie iets plaas wat 'n verleentheid sou wees nie! As jy later iewers in die Openbare Kamer gaan werk, ja, dit is beter om nie kommentaar te lewer nie. As jy dit nie gaan doen nie, gee niemand om nie. Ek kan jou net verseker dat niemand jou persoonlike korrespondensie lees nie, en dit alles bou hierdie hele storie op...

    Elke week kom iemand beslis na my toe en sê: “Wel, my vriend se foto’s het na een of ander anonieme publieke blad uitgelek! Help! Terloops, moet nooit iets op anonieme publieke bladsye publiseer nie.

  • Ek weet nie van ander moniteringstelsels nie - ons sal dit beslis in ag neem, dat die vermelding van die handelsmerk negatief was, God vergewe my... Maar ek kan sê dat allerhande naby-staat kamerade net in mense belangstel wat 'n gehoor van meer as 5 duisend het, en hul openbare mening kan iemand beïnvloed. In my ervaring het dit nog nooit gebeur dat die HR-agentskap wat profielbeoordelings by ons bestel, gesê het: "Wie ook al van Navalny hou, moet niemand aanstel nie!"

Oor die publikasie van die resultate. Hoeveel mense is in navorsing werksaam?

  • Van die top 10 advertensiemaatskappye publiseer sewe nou. Dit is moeilik om te sê: toe ons dit 'n jaar en 'n half gelede begin het... Ons het verskeie mense in elke area - daar is verskeie mense in banke, daar is verskeie mense in HR, daar is verskeie mense in advertensies. En nou dink ons ​​aan wie meer winsgewend is om eerste te gaan, vir wie ons 'n paar koppelvlakke moet begin maak ...
  • (oor die aantal mense per marksegment) Nie meer as 25 mense nie, want ons het niemand verkrag nie.
  • Oor die algemeen word hierdie tegnologieë van die mark in beginsel met meer as 50% gebruik, dink ek. Sommige in advertensieveldtogte, sommige in 'n soort interne ontleding. Ek sou sê 40 persent gebruik dit in interne analise, 50-60% verkoop dit aan die einde van handelsmerke. Maar dit hang reeds van die advertensiemaatskappye self af. Jy sien, sommige mense rapporteer bloot vir die geld wat hulle spandeer het, die advertensies wat hulle in plek gesit het, terwyl ander skryf oor hoeveel mense hulle gebring het, watter soort gehoor ... Ek sou so sê, maar ek kan verkeerd wees - ek doen' Ek kan jou nie regtig voorstel hoe al hierdie kamerade werk nie. Ek weet slegs in kwantitatiewe data.

Sommige advertensies 🙂

Dankie dat jy by ons gebly het. Hou jy van ons artikels? Wil jy meer interessante inhoud sien? Ondersteun ons deur 'n bestelling te plaas of by vriende aan te beveel, wolk VPS vir ontwikkelaars vanaf $4.99, 'n unieke analoog van intreevlakbedieners, wat deur ons vir jou uitgevind is: Die hele waarheid oor VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps vanaf $19 of hoe om 'n bediener te deel? (beskikbaar met RAID1 en RAID10, tot 24 kerne en tot 40 GB DDR4).

Dell R730xd 2x goedkoper in Equinix Tier IV-datasentrum in Amsterdam? Net hier 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV vanaf $199 in Nederland! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - vanaf $99! Lees van Hoe om infrastruktuur korp. klas met die gebruik van Dell R730xd E5-2650 v4-bedieners ter waarde van 9000 XNUMX euro vir 'n sent?

Bron: will.com

Voeg 'n opmerking