Arthur Khachuyan: "Benetako Big Data publizitatean"

14ko martxoaren 2017an, Arthur Khachuyanek, Social Data Hub-eko zuzendari nagusiak, BBDO hitzaldian hitz egin zuen. Arthur-ek monitorizazio adimentsuaz, jokabide-ereduak eraikitzeaz, argazki eta bideo-edukiak antzemateaz hitz egin zuen, baita sare sozialak eta Big Data teknologiak erabiliz publikoak bideratzeko aukera ematen duten Social Data Hub tresna eta ikerketez ere.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Artur Khachuyan (aurrerantzean - AH): - Kaixo! Kaixo guztioi! Nire izena Arthur Khachuyan da, Social Data Hub konpainia zuzentzen dut, eta datu irekien iturrien, informazio-eremuen analisi intelektual interesgarri ezberdinetan aritzen gara eta era guztietako ikerketa interesgarri eta abar egiten ditugu.

Eta gaur BBDO Taldeko lankideek big data aztertzeko teknologia modernoei buruz hitz egiteko eskatu digute, publizitaterako big data eta ez hain big data: nola erabiltzen den, adibide interesgarri batzuk erakutsi. Bidean galderak egingo dituzula espero dut, aspertu egin naitekeelako eta funtsa ez agerian utzi eta abar, beraz, ez izan lotsati.

Egia esan, norabide nagusiak, "datu ia big-data" konponbideren bat erabili den tokietan, guztiak argiak dira: hau da, audientziaren xedea, azterketa, marketin-ikerketa analitikoa egitea. Baina beti da interesgarria zer datu osagarri aurki daitezkeen, zer esanahi osagarri aurki daitezkeen analisia aplikatu ondoren.

Zergatik behar dugu teknologia publizitatea egiteko?

Nondik hasten gara? Sare sozialetan publizitatea da nabariena. Gaur goizean kendu dut: arrazoiren batengatik VKontaktek uste du iragarki zehatz hau ikusi beharko nuela... Ona ala txarra den bigarren galdera da. Ikusten dugu behin betiko konscriptoen kategorian sartzen naizela:

Arthur Khachuyan: "Benetako Big Data publizitatean"

Irtenbide teknologikotzat har daitekeen lehenengo gauza eta interesgarriena... Hasi baino lehen erabaki nahi nuen lehenengo gauza terminoak zehaztea da: zer da open data eta zer da big data? Pertsona guztiek dutelako bere ulermena gai honen inguruan, eta nik ez dizkiot nire baldintzak inori inposatu nahi, baina... Desadostasunik egon ez dadin.

Pertsonalki, datu irekiak inongo saio-hasipenik edo pasahitz gabe irits dezakedan guztia dela uste dut. Hau sare sozialetako profil irekia da, hau bilaketa-emaitzak dira, hauek erregistro irekiak, etab. Big data, nire ustez, honela ikusten dut: datu-plaka bat bada, mila milioi errenkada dira, nolabaitekoa bada. fitxategiak biltegiratzeko, nonbait datu petabyte bat da. Nire terminologian gainerakoa ez da big data, horrelako zerbait baizik.

Zehaztasun handiko profila eta profilaren puntuazioa

Goazen ordenan. Datu irekien iturriak aztertzetik ekar dezakezun gauzarik lehenengo eta interesgarriena doitasun handiko profila eta profilaren puntuazioa da. Zer da hau? Zure sare sozialeko kontuak nor zaren ez ezik, zure interesak bakarrik iragar ditzakeen istorio bat da.

Baina orain, hainbat iturri konbinatuz, zure soldataren batez besteko maila, zure apartamentuak zenbat balio duen eta non dagoen ulertu dezakezu. Eta datu horiek guztiak literalki erabil daitezke eskuragarri dauden bitartekoetatik. Adibidez, zure kontua sare sozial batean hartzen baduzu, begiratu, esan, non bizi zaren, non lan egiten duzun; lan egiten duzun enpresaren negozioaren zer ataletan dagoen ulertzea; deskargatu HH eta “Superjob” antzeko lanpostu hutsak, analista, gerentea, etab. bazara; begiratu non bizi zaren (oinarria, esan CIAN), ulertu zenbat kostatzen den toki honetan etxebizitza bat alokatzeak, zenbat kostatzen den toki honetan etxebizitza bat erostea, aurreikusi gutxi gorabehera zenbat irabazten duzun. Gainera, zure sare sozialak erabiliz, zenbat bidaiatzen duzun, non zauden eta zure enplegatzailearekiko zenbat leial zaren uler dezakezu.

Horren arabera, neurri kopuru handi batetik nahi dugun guztia egin dezakegu. Interesatzen zaizun produktua aurkeztu ahal dizugu. Imajinatzen al duzu online denda bat? Hara joaten zara - lineako denda honek zure kontua sare sozial batean harrapatzen du eta esaten dizu: "Masha, zure mutil-lagunarekin hautsi berri zara, hona hemen produktu jakin batzuk zuretzat". Hau ez da etorkizun hurbila...

Nola zehazten da pertsona baten geokokapena?

Entzuleen galderei erantzunak:

  • Normalean, check-in guztien % 80 bizileku zehatztzat hartzen da. Baina inon fakturazioa egiten ez duen jendearentzat, hainbat aukera daude: edo fakturazioa, edo geolokalizazioa, edo hau mezu eta argitalpenen azterketa da, pertsona batek zerbait idazten duen denbora-tarte osorako... Eta nonbait, zerbait agertuko da "Korotxo bat erosi nahi dut Akademicheskayatik gertu" edo "Duela gutxi hemengo horman grafiti itsusiak ikusi ditut". Hau da, pertsonen ia %80rentzat geokokapena, lantokia eta bizilekua zehaztu daitezke sare sozialetatik jaso daitezkeen datu edo metadatuak erabiliz.

    Hau, berriro ere, mezuen analisia da. Zentzurik errazenean, sare sozialetako check-inen eta geokokapenen analisia da, jpeg metadatuak ezabatzen ez dituztenak (zerbait atera dezakezu). Baina gainerako pertsonentzat, normalean testu-igorpenak izaten dira: edo pertsona batek bere kokapena "distira" egiten du zerbaiti buruz idazten duenean, edo bere telefonoa "distira" egiten du, horren bidez bere iragarkietako batzuk Avito-n edo bere kontuan aurki ditzakezu " Auto RU". Datu hauetan oinarrituta, konbinatu (adibidez, "Maiakovskayatik gertu auto bat saltzen dut") eta gutxi gorabehera hau suposatu dezakezu.

  • Jendeak hau argitaratu ohi du sare sozialetan. Iturburu irekiekin bakarrik lan egiten dugu eta hemen iturri irekiez soilik hitz egiten ari gara. Normalean iragarkiak argitaratzen dituzte, hau da, kasuen ehuneko hirurogeietan, jendeak bere egungo telefono-zenbakia “erakusten” duenean ohikoena zerbaiten salmentaren iragarkiak dira. Edo talde batzuetan pertsona batek idazten du (“hau edo bestea saltzen dut han”), edo norabait joaten da.

    Bai! Honela komentatzen dute normalean: “Erantzun edo bidali SMS bat, deitu nire zenbakira. Askotan gertatzen da hori zerbait saltzen duten pertsonei, sare sozialetan zerbait erosten dutenei, norbaitekin komunikatzen den pertsonei... Horren arabera, zenbaki hori erabiliz gero, CIAN-en duen profila harekin lotu ahal izango duzu, inoiz zerbait argitaratu badu, edo, berriro ere, Avito. Hauek dira iturri ezagunenak, goi mailakoak, aurrerago egongo dira - hauek dira Avito, CIAN eta abar.

  • Honek lineako denda bati egiten dio erreferentzia. Jarraian, aurpegi-ezagutzarako teknologia eta profila parekatzea izango da (horretaz hitz egingo dugu). Teorikoki, hau lineaz kanpoko denda batean aplika daiteke. Eta, oro har, nire amets handia da kaleko pankartak agertzen direnean, kamera baten ondotik pasatzen zarenean, zure aurpegia “harrapatzen” duzula. Baina kasu hau legeak debekatuko du, pribatutasunaren urraketa delako. Espero dut lehenago edo beranduago gertatuko dela.
  • Esperientzia pertsonaletik. Askotan, pertsona batek zerbait idazten dizunean, jakin behar ez zenituzkeen bere bizitzako gertakari batzuk ebakuntza egiten dituzu... Jendea kasu gehienetan beldurtzen da. Baina! Azken estatistiketan oinarrituta, sare sozialetan itxitako kontuen kopurua %14 murriztu da. Faltsuen kopurua handitzen ari da, irekitako kontuen kopurua hazten ari da - jendea gero eta gehiago ari da irekiera bidean. Uste dut 3-4 urte barru norbaitek jakin behar ez lukeen informazioa jakitearen aurrean hain erreakzionatzeari utziko diotela. Baina egia esan oso erraza da bere hormara begiratuta lortzea.

Zer hartu daiteke iturri irekietatik?

Iturburu irekietatik nahiko fidagarritasun handiz uler daitezkeen gauzen gutxi gorabeherako zerrenda dago. Izan ere, are metrika ezberdin gehiago daude; ikerketa horren bezeroaren araberakoa da. Badago HR agentzia bat sare sozialetan edo espazio publikoan zin egiten duzun ala ez interesatzen zaiona. Norbaiti interesatzen zaio Navalnyren argitalpenak edo, alderantziz, Errusia Batuaren argitalpenak edo eduki pornografikoren bat gustatzen zaizkizun ala ez; horrelakoak sarritan gertatzen dira.

Nagusiak familia-balioak, apartamentu baten gutxi gorabeherako kostua, etxebizitza, kotxe bat bilatzea eta abar dira. Horren arabera, pertsonak talde sozialetan banatu daitezke. Hauek Moskuko Tinder erabiltzaileak dira, nortzuk diren (Facebookeko kontuetan aurkitutako argazkien arabera); beren interesen arabera, hainbat gizarte taldetan banatzen dira:

Arthur Khachuyan: "Benetako Big Data publizitatean"

Publizitatera hurbiltzen bagara, poliki-poliki iragarki-bideratze estandarretik aldendu gara, VKontakte-n talde jakin batzuetara harpidetuta dauden 18 urteko gizonezkoak interesatzen zaizkizula hautatzen duzunean. Hurrengo argazki hau daukat, orain erakutsiko dizut:

Arthur Khachuyan: "Benetako Big Data publizitatean"

Ondorioz, gaur egungo zerbitzu gehienak, printzipioz, sare sozialak aztertzen dituzten pertsonak aztertzen dituztenak, interesak aztertzen dihardutela... Jendeari burura etortzen zaion lehenengo gauza harpidedunen talde nagusiak aztertzea da. Agian zenbaitentzat balio du horrek, baina pertsonalki uste dut funtsean gaizki dagoela. Zergatik?

Zure gustukoak bildu eta aztertzen dira

Hartu orain zure telefonoak, begiratu zure talde nagusiak - zalantzarik gabe, dagoeneko ahaztu dituzun taldeen % 50 baino gehiago egongo dira, hau zuretzat garrantzirik gabeko edukia da. Ez duzu batere kontsumitzen, baina, hala ere, sistemak haien arabera egingo dizu jarraipena: errezetetara harpidetuta zaudela, talde ezagun batzuetara. Hau da, zure profila aztertzen duen sistema urratuko duzu, eta zure interesak ez dira justifikatuko.

Aurrera... Zer dago hor? Besteek egiten dutena suposatzen dugu. Gure ustez, erabiltzaileen interesak baloratzeko modurik egokiena atseginak dira. Adibidez, VKontakte-n ez dago gustuko jariorik, eta jendeak uste du inork ez dakiela zer gustatzen zaion. Bai, gustatu batzuk Instagramen sartzen dira, Facebooken ikusten dugu zerbait, baina talde jakin batzuen eduki gehienek ez dute hori jario komun batean igortzen, eta jendea bizi da eta pentsatzen du inork ez duela jakingo zer gustatzen zaion.

Eta interesatzen zaizkigun nolabaiteko eduki batzuk bilduz, argitalpen hauek bilduz, gustatu hauek bilduz, gero pertsona hau datu-base hau erabiliz egiaztatuz, zehaztasun handiz zehaztu dezakegu nor den, zein den bere patua, zer interesatzen zaion. Kokatu zehatz-mehatz gizarte-talde jakin batean eta harekin elkarreragin.

Auto bat erosteak portaera aldatzen du

Badaukat halako adibide bat. Berehala erreserba egingo dut nire adibideak ia publizitatea eta ia marketina direla, zeren eta, badakizu, kasu gehienak NDAk eta abar babestuta daudelako. Baina oraindik gauza interesgarri asko egongo dira. Beraz, pertsona hauekin istorioa: 2010 eta 2015 artean auto bat erosi zuten gizonak dira. Sareko portaera soziala nola aldatu den kolorearen bidez adierazten da. Harpidedunen artean nesken ehunekoa aldatu egin da, orrialde publiko “mutiletan” harpidetu naiz, sexu bikote iraunkor bat aurkitu dut...

Arthur Khachuyan: "Benetako Big Data publizitatean"

Hau guztia auto markaren eta pertsona kopuruaren arabera banatzen da. Hemendik ondorio interesgarri asko atera ditzakezu pertsonen jokabideari eta horrek guztiak nola funtzionatzen duen. Esan dezaket Porsche Cayenne eta landatutako Priora ia berdinak direla erakarritako publiko kopuruari dagokionez. Ikusle honen kalitatea eta haien portaera desberdinak dira, baina kantitatea gutxi gorabehera berdina da. Hemendik atera dezakezun ondorioa nahi duzuna da, zure merkatutik hurbilago. Audi bat saltzen baduzu, “Erosi Audi bat eta alde egin gurasoengandik!” leloa egiten duzu. eta abar.

Bai, hau da, gustukoen analisian oinarritutako pertsonen jokaera, zein taldetara mugitzen den, zein eduki aztertzen duten kontuan hartuta, ia % 100eko probabilitatearekin argi uzten du nor zaren. Sareko trafikorako sarbidea ez baduzu eta mezu pertsonalak irakurtzen ez badituzu, gustukoek beti esango dizute nor den pertsona hori: haurdun dagoen emakume bat, ama, militar bat, polizia bat. Eta zuretzat, iragartzeko gai zaren pertsona gisa, arrakasta handia da.

Entzuleen galderei erantzunak:

  • Zutabe bakoitza kotxe honetako pertsona kopurua da; nola aldatu diren haien portaera-ereduak. Begira: Porsche Cayenne bat erosi duten pertsonak - 550 pertsona inguru (horia), harpidedunen artean nesken ehunekoa handitu da.
  • Lagina "Vkontakte", "Facebook", "Instagram" sare sozialen erabiltzaileak dira 2010etik 2015era. Argibide bakarra: hemen aukeratutako autoak zenbait tresna erabiliz argazkietan %80 baino gehiagoko zehaztasunarekin identifikatu daitezkeenak dira.
  • Denbora tarte jakin batean, bere kotxea (beno, hau da, berea ez, hori sare sozialen esku uzten dugu)... Denbora tarte jakin batean, pertsona bati etengabe ateratzen zitzaion kotxearekin argazkiak, berarekin zegoen, argitalpenak. desberdinak ziren, argazkiak angelu ezberdinetakoak ziren, eta abar. Ondoren, argazki bat egongo da jendea zein autorekin ateratzen ari den argazkiak eta... Bai, hau da bigarren galdera - sare sozialetako datuetan konfiantza.
  • Atera genuenetik, zoritxarrez, sare sozialetako datuak ez dira beti zuzenak. Jendeak ez du beti bere informazioa argitaratzeko joera. Pertsonalki, ikerketa bat egin nuen: Moskuko unibertsitateetako tituludunen kopurua sare sozialetan erregistratutako jende kopuruarekin alderatu nuen. Batez beste, sare sozialetan % 60 pertsona gehiago erregistratzen dira - urte jakin batean Moskuko Unibertsitateko lizentziatuak espezialitate batzuetan - printzipioz baino. Beraz, bai, noski, hemen akatsen ehuneko bat dago, eta inork ez du ezkutatzen. Hemen, besterik gabe, oinarritzat hartzen ditugu %80ko probabilitatea baino gehiagorekin identifikatu daitezkeen autoak.

Ereduen prestakuntzarako iturrien zerrenda

Hona hemen erabil daitezkeen iturrien zerrenda lagin bat, pertsona baten profil soziala, nor den, ziurtasun handiz zehazteko erabiltzen dena.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Sare sozialetatik profil bat hartzen dugu, CIAN-tik - apartamentu baten kostua gutxi gorabehera, "Head-Hunter", "Superjob" da - hau da pertsona jakin baten batez besteko soldata. Espero dut hemen Head Hunter-en ordezkaririk ez egotea, datu hauek haiengandik hartzea ez dela oso ona iruditzen zaielako. Hala ere, hauxe da zenbait eskualdetako batez besteko soldata lanpostu hutsetarako jarduera mota batzuetarako.

"Avito", "Avto.ru": askotan jendeak, telefonoa piztuta dagoenean, behin betiko daukate (kasu kopuru handi batean) gutxienez zerbait "Avito"-n edo "Avto.ru"-n. beste hainbat gunetan zeintzuk diren ulertzeko. Telefono-zenbaki honetan kotxe bat edo kotxe bat saldu bazen... Rosstat eta Pertsona Juridikoen Estatu Batuaren Erregistroa oraindik ere erregistro gehiago dira, zeinen laguntzarekin enpresa enplegatzailea sailkatu dezakezu -formula batzuen arabera, eredu baten arabera. edozein pertsonak ezarri dezake (gutxi gorabehera zehaztu dezakezu pertsona honen dirua etab.).

Tinder-ek pertsonen egoerari buruzko datuak biltzen laguntzen du

Gainera, gauza interesgarri bat dago (bestela, oso dibertigarria da ikerketan) - hau da, berriro ere, Moskuko Tinder-en datuen bilketa Tinder honetarako bot-ak erabiliz. Jendearekiko distantzia zehaztu zen, eta gero haien gutxi gorabeherako kokapena zehaztu zen.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Azterketa honen helburua gobernuko erakundeen lurraldean Tinder kontuen kopurua zehaztea zen - Duman, fiskaltzan, etab. Baina zuk, iragarle gisa, nahi duzuna imajina dezakezu: izan daiteke, adibidez, Starbucks edo beste norbait... Hau da, kafea edaten dizuten Tinder-en, zerbait eskatzen, dendetan dagoen jende kopurua. Geokokapen honi dagokionez: edozein zerbitzurekin egin daiteke.

Entzuleen galdera bati erantzuna:

  • Tinder? Ez dakizu? Tinder zita-aplikazio bat da, non argazkiak begiratzen dituzun (ezker-eskuin), eta aplikazio honek pertsonarekiko distantzia erakusten dizu. Pertsona honen distantzia hiru puntu ezberdinetatik lortzen baduzu, gutxi gorabehera (+ 5-7 metro) kokapena zehaztu dezakezu. Kasu honetan, Fiskaltzaren edo Estatuko Dumako lurraldean zehaztea, ez da hain zaila. Baina berriro ere, zure denda izan daiteke, edozer izan daiteke.

Esate baterako, aspaldi, aspaldiko kasua izan genuen (ez ikerketa bat), operadore zelularretako batengandik trafiko-dentsitateari buruzko datuak, puntu zelularren mugimendu-dentsitateari buruzko datuak eta informazio hori guztia gainjarri zenean. autobideetan kokatutako kartelen koordenatuetan . Eta telefono mugikorren operadorearen zeregina da, gutxi gorabehera, zenbat jende pasatzen ari den eta iragarki-taul hau ikus dezakeen zehaztea.

Hemen iragarkietako iragarkietako espezialistak badaude, esan dezakezu: ezinezkoa da fidagarritasun handiz ulertzea - ​​norbait dator, norbaitek ez du begiratu, norbaitek begiratu... Hala ere, hau 20 milioi poligono dauden erakusten duen adibidea da. hauek Moskun, zein den jende hauen dentsitatea orduro bide jakin batzuetan... Ikus dezakezu zer pasatzen ari ziren pertsona horiek edozein momentutan eta gutxi gorabehera bidaiarien fluxua kalkulatu.

Entzuleen galdera bati erantzuna:

  • Inork ez du halako daturik ematen. Horrelako azterketa bat egin genuen operadoreetako batentzat; hau barne istorio esklusibo bat da, beraz, zoritxarrez, ez da irudi moduan aurkezten. Baina askotan publizitate agentzia handiek ez dute arazorik operadore batekin harremanetan jartzeko. Moskun behintzat, aurrekari asko daude, adibidez, aseguru-etxeek GetTaxi bezalako enpresetara jotzen dutenean, gidariaren adinari buruzko datu inpertsonalak ematen dituztenean, nola gidatzen duten (ona - txarra, arduragabea - ez), aurreikusteko asmoz. politikak eta abar. Honekin denek borrokatzen dute, baina barne maila batean, datu anonimoak emanez - uste dut inork ez duela horrelako arazorik.

Irudiak eta ereduak ezagutzeko

Segi aurrera. Nire gogokoena irudien aitorpena da. Aurpegien arabera jendea bilatzeari buruzko pieza txiki bat egongo da, baina gehienetan ez dugu parte hau hartzen. Bereziki irudiak ezagutzen ditugu eta irudi honetan zer dagoen zehazten dugu: autoaren marka, kolorea, etab.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Adibide barregarri hau daukat:

Arthur Khachuyan: "Benetako Big Data publizitatean"

Hainbat sare sozialetan tatuajeak bilatzeko ikerketa bat zegoen. Horren arabera, gauza bera aplika dakioke edozein markari, edozein irudi bisualari, ia edozein irudi bisualari. Badira fidagarritasunez zehaztu ezin direnak (ez ditugu hartzen).

Arthur Khachuyan: "Benetako Big Data publizitatean"

Hona hemen nire gogokoena. Auto-markek sarritan jotzen dute zeregin horretara, haien zeregina, adibidez, BMW X6 batzuen jabe guztiak aurkitzea baita, nortzuk diren ulertzea, nola konektatzen diren elkarren artean, zer interesatzen zaien, etab. Jendeak sare sozialetan argazkiak zer autorekin ateratzen dituen galderari dagokio.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Hemen ez zegoen batere iragazketarik: objektua haiena zen, autoa ez zen haiena; Autoen matxura besterik ez da: adina eta abar. Baina ikusizko irudien aitorpena sarritan erabiltzen da: hau da haurdun dauden emakumeen bilaketa, eta marken logotipoak bilatzea zenbait hedabidetan (nork zer argitaratzen du).

Arthur Khachuyan: "Benetako Big Data publizitatean"

Nire kasurik gogokoena (hainbat jatetxek erabiltzen dutena): zer-nolako erroiluak jartzen diren sare sozial batean. Gauza dibertigarria da, baina egia esan gauza interesgarri asko ulertzeko aukera ematen dizu, lehenik eta behin, zure bezeroei buruz: nor etorri zitzaizun eta zergatik egin zuten. Ez baita sekretua sushi tabernetan jende gehiena (ez dut esango "neskak") argazkiak ateratzea egiaztatzeko, zerbaiten argazkia ateratzeko, etab.

Markak horretaz aprobetxatu dezake. Markari interesatzen zaio zer nolako produktuak behar dituen ederki argazkiak ateratzeko eta argitaratzeko, nolako jendea bertaratu den. Gauza hau ia edozerrekin egin daiteke, janaritik.

Bideo ereduen antzematea

Entzuleen galdera bati erantzuna:

  • Ez bideoan. Proba moduan daukagu. Teknologia hau probatu dugu, baina hori gertatzen da... Bideoarekin dena nahiko ondo ezagutzen du, baina ez dugu inon aplikaziorik aurkitu. Agur. Nonbait zenbat eta zein bideo blogari hitz egiten ari diren aztertzeaz gain... Halako azterketa bat zegoen. Zenbat aurpegi elkartzen dira, zenbat maiz. Baina markek oraindik ez dute asmatu nondik atera. Agian noizbait iritsiko da.

Berriz ere, hau janaria da, haurdun dauden emakumeak, gizonak (ez haurdun), autoak - edozer izan daitezke.

Aukera gisa, Urte Berriko azterketa bat zegoen hedabide baterako. Publizitatetik urrun ere bai, baina hala ere. Hau da jendeak urte berrirako barau egiten duen janari mota:

Arthur Khachuyan: "Benetako Big Data publizitatean"

Hemen ere adinaren arabera banatzen da. Halako korrelazioa ikus dezakezu, gazteek gehienbat janaria eskatzen dutela, helduek gehienbat mahai tradizionala egiten dutela. Gauza dibertigarria da, baina marka jabe gisa imajinatuz, gauza asko ebalua ditzakezu: nork maneiatzen duen zure produktua eta nola, zer idazten duen horri buruz. Askotan, jendeak ez du beti testuan marka bera aipatzen, eta jarraipen analitikoko sistema tradizionalek ezin dute beti ulertu eta aurkitu markaren aipamen hori testuan aipatzen ez delako soilik. Edo testua gaizki idatzita dago, ez dago hash etiketarik edo ezer.

Argazkiak ikusgai daude. Argazkiarekin, markoaren erdiko gaia den ala ez markoaren erdiko gaia esan dezakezu. Orduan ikus dezakezu zer idatzi duen pertsona honek. Baina gehienetan kotxe jakin batzuk gidatu dituzten publiko potentzialen bilaketa gisa erabiltzen da eta abar. Eta gero gauza interesgarri asko egingo ditugu auto hauekin.

Botei gizakiak imitatzen irakasten zaie

Pertsonak zenbatzeko aukera ere bazegoen:

Arthur Khachuyan: "Benetako Big Data publizitatean"

Jendea alderatzeko aukera dago, argazki batzuk erabiliz jendea aurkitu behar duzunean, haien profil soziala ulertu, nor diren. Berriro ere, galderara itzuliko gara: kamera bat lineaz kanpoko denda batean badugu, hau nahiko modu ona da zuregana nor datorren, pertsona horiek nor diren, zer interesatzen zaien, zerk bultzatu dituen zuregana etortzera ulertzeko. .

Jarraian, interesgarriena dator: sare sozialetan haien kontuak biltzen baditugu, pertsona horiek nortzuk diren, zer interesatzen zaien ulertzen badugu, pertsona horien antzeko bot bat egin dezakegu (aukeran); bot hau pertsona hauek bezala bizitzen hasiko da eta hainbat sare sozialetan zer iragarki ikusten dituen aztertuko du. Horri esker, zehaztasunez ulertuko duzu zein marka dauden pertsona honi zuzenduta. Hau ere nahiko istorio arrunta da pertsona hori nor den eta zein interes dituen aztertu behar duzunean, baita zure lehiakide potentzialak edo interesa duten beste pertsona batzuek zein publizitate-mota bideratu behar duten aztertu behar duzunean ere.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Sare sozialetako konexioen analisia

Arthur Khachuyan: "Benetako Big Data publizitatean"

Hurrengo gauza interesgarria pertsonen arteko harremanen azterketa da. Egia esan, sareko konexioen analisia, sareko grafiko hauek - ez dago ezer berririk, denek dakite hori.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Baina publizitate zereginetarako aplikazioa da interesgarriena. Hau joerak ezartzen dituen pertsonen bilaketa da, hau sare honen barruan irizpide batzuen arabera informazioa zabaltzen duten pertsonen bilaketa da. Demagun BMW modelo jakin baten jabe berberak interesatzen zaizkigula. Guztiak elkartuz, iritzi publikoa kontrolatzen dutenak aurki ditzakegu. Hauek ez dira zertan automobilgintzako blogariak eta abar. Normalean hainbat orrialde publikotan esertzen diren burkide soilak dira, eduki batzuetan interesa dutenak eta, oso denbora laburrean, zure marka edo zuretzako interesgarria den norbait ardura-eremu honetara erakar dezakete, arlora. interesa.

Bada hemen horrelako adibide bat. Pertsona potentzial batzuk ditugu, pertsonen arteko loturak. Hemen laranjak pertsonak dira, puntu txikiak talde arruntak, lagun arruntak.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Haien arteko lotura horiek guztiak bilduz gero, oso argi ikusiko duzu talde komun ugari dituen jendea dagoela, lagun komunak, euren artean daudela... Eta bisualizazio hori bera interesen arabera taldetan banatzen bada, edukiaren arabera, zein banatzen duten, zenbaterainoko elkarreragina duten elkarren artean... Hemen ikus dezakezue aurreko argazkia honela geratu zela:

Arthur Khachuyan: "Benetako Big Data publizitatean"

Hemen taldeak argi bereizten dira kolorearen arabera. Kasu honetan, hauek dira Ekonomia Goi Eskolako gure masterreko ikasleak. Hemen ikus dezakezue moreak/urdinak Transparency International, Open Russia eta Khodorkovskyren orrialde publikoak maite dituztenak direla. Behean ezkerreko berdeak daude, Errusia Batua maite dutenak.

Ikusten duzu aurreko argazkia horrelakoa zela (pertsonen arteko loturak besterik ez dira), baina argi eta garbi mugatu egin dela. Hau da, pertsona guztiak beti elkarren artean lotuta daude, interes berdinak dituzte, elkarren lagunak dira. Batzuk goian, beste batzuk behean, eta beste zenbait kamarada hor. Eta azpigrafe txiki horietako bakoitza beste parametro batzuekin bereizita bistaratzen bada eta edukien zabalkundearen abiadurari erreparatzen badiote (gutxi gorabehera, nork zer berri ematen duen han), zati bakoitzean beti iritzi publikoa eskuetan duten pertsona bat edo bi aurki ditzakezu, horrekin elkarreraginean, mezu motaren bat edo beste zerbait bidaltzeko eskatuz, ikusle interesgarri honen erantzuna lor dezakezu.

Badaukat halako beste adibide bat. Grafiko bat ere: sare sozialetan aurkitutako BBDO Taldeko langileak dira adibide gisa. Interesgabea dirudi, handia, berdea, haien arteko loturak...

Arthur Khachuyan: "Benetako Big Data publizitatean"

Baina badaukat aukera bat non dagoeneko taldeak eraikita dauden haien artean. Gero, norbait interesatuta badago, bertsio interaktibo bat dago: klik egin dezakezu eta begiratu bat eman.

Goian eskuinaldean Putin maite dutenak daude. Hemen moreak dira diseinatzaileak; diseinuan interesa dutenek, zerbait interesgarria, etab. Hemen gauza zuriak zuzendaritza taldea dira (antza, ulertzen dudanez); Hauek, oro har, inola ere lotuta ez dauden pertsonak dira, baina gutxi gorabehera postu berdinetan lan egiten dutenak. Gainerakoak euren talde komunak, loturak eta abar dira.

Markek ez dute blogaririk behar, iritzi liderrak baizik

Pertsona hauek hartzen ditugu eta aurkitzen ditugu -gero publizitate-agentziak, publizitate-enpresak bere kabuz erabakitzen du: pertsona horri dirua eman diezaioke, nolabait, eduki honekin, beste zerbaitekin, elkarreragin dezan edo haiei zuzendu diezaieke bere publizitate-kanpaina zehatza. Hau ere sarritan erabiltzen da, batez ere orain, marka guztiek blogariekin lan egin nahi dutelako, haien edukia sustatu nahi dutelako, baina publizitate agentziek ez dute benetan harremanetan jarri nahi (beno, hau gertatzen da).

Eta egoera honetatik irteteko benetako bidea blogariak ez diren pertsonak aurkitzea da, ez edertasun blogariak, baina adibidez, marka honekin elkarreragiten duten benetako izaki batzuk, "Mail.ru Erantzunak" orrialde publiko tamalgarri batzuetan idatz ditzaketenak, lortu. ikustaldi kopuru jakin bat. Pertsona honen edukietan etengabe interesatzen diren pertsona horiek guztia zabalduko dute, eta markak bere inplikazioa lortuko du.

Teknologia hori erabiltzeko bigarren aukera nahiko garrantzitsua da orain: bot-ak bilatzea, nire gogokoena. Hau zure lehiakideentzako ospe-arriskua da, eta publizitate-kanpaina batetik garrantzirik gabeko jendea kentzeko aukera bat, eta beste edozer gauza (iruzkinak ezabatzea eta pertsonen arteko konexioak bilatzea). Adibide bat daukat, handia eta interaktiboa ere bada - mugitu dezakezu. Lentach komunitatean iruzkinak idatzi dituzten pertsonen konexioak dira.

Adibide hau bot-ak zein ondo eta erraz ikusten diren ulertzeko da; eta horretarako ez duzu ezagutza teknikorik eduki behar. Horrek esan nahi du "Lentach"-ek Dmitry Medvedev-i buruzko FBK-ren ikerketari buruzko mezu bat argitaratu zuela eta zenbait pertsona iruzkinak idazten hasi zirela. Iruzkinak idatzi dituzten pertsona guztiak bildu ditugu; pertsona hauek berdeak dira. Orain mugituko dut:

Arthur Khachuyan: "Benetako Big Data publizitatean"

Jendea berdeak dira (iruzkinak idatzi dituztenak). Hemen daude, hemen daude. Bien arteko puntu urdinak euren talde komunak dira, puntu horiak euren harpidedun, lagunak eta abar komunak. Jende gehiena elkarren artean lotuta dago. Zeren eta, hiru, lau, bost bostekoen teoria edozein dela ere, pertsona guztiak elkarren artean konektatuta daude sare sozialetan. Ez dago elkarrengandik bereizita dagoen jenderik. VKontakte esklusiboki bideoak ikusteko erabiltzen duten nire lagun sozial fobikoak ere gu bezalako orrialde publiko batzuetara harpidetuta daude.

Navalny-k bot-ak ere erabiltzen ditu. Denek dituzte bot-ak

Jende gehiena (hemen dago, hemen) elkarren artean lotuta dago. Baina bada elkarren adiskide soil-soilik diren burkide talde txiki bat. Hemen daude, txiki berdeak, hemen elkarren arteko lagunak eta taldeak. Hemen ere bananduta erori ziren:

Arthur Khachuyan: "Benetako Big Data publizitatean"

Eta zortezko kasualitatez, hain zuzen ere, hauek izan ziren mezu honen azpian idatzi zutenak: “Navalny-k ez du frogarik” eta abar, eta iruzkin berak idatzi zituztenak. Noski, ez naiz ausartzen ondorioak ateratzen. Baina, hala ere, Facebook-en nuen beste mezu bat, Lebedev eta Navalny-ren arteko eztabaida egon zenean, iruzkinak modu berean aztertu nituen: "Lebedev kaka da" idatzi zuten pertsona guztiak ez zirela sare sozialetan egon. sareak duela lau hilabete, orrialde publikoren batean harpidetu gabe, bat-batean mezu zehatz honetara joan ziren, iruzkin zehatz hau idatzi eta alde egin zuten. Berriz ere, ezinezkoa da hemendik ondorioak atera, baina Navalny-ren taldeko norbaitek iruzkin bat idatzi zidan ez duela botrik erabiltzen. Beno, ados!

Publizitatetik gertuago, markatik gertuago. Denek dituzte bot-ak orain! Guk ditugu, gure lehiakideek dituzte, eta besteek. Ondo bizitzeko bota edo utzi behar dira; Horrelako datuetan oinarrituta (aurreko diapositiba seinalatzen du), eraman itzazu perfekziora, benetako pertsona itxura izan dezaten eta soilik erabili. Botak erabiltzea txarra den arren! Hala ere, istorio nahiko arrunta...

Modu automatikoan, horrelako gauza batek zure analisitik iragazteko aukera ematen du analisirako garrantzirik ez duten pertsonak, laginean sartu behar ez direnak, ez dira azterketa honetan sartu behar. Oso maiz erabiltzen da. Berriro ere, autoen jabe guztiek ez dituzte autoak. Batzuetan jendeari bakarrik interesatzen zaio kotxe bat izan dezakeen jendea, talde batzuetan esertzen direnak, norbaitekin komunikatzen direnak, publiko jakin bat daukatenak.

Gertaeren eta iritzien analisia

Dudan hurrengoa ere gogokoena da. Hau gertakarien eta iritzien analisia da.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Gaur egun denek daki bere marka aipatzen hainbat iturritan. Ez dago horretarako sekreturik. Eta badirudi denek tonalitatea kalkulatzeko gai dela... Nahiz eta pertsonalki, uste dut tonalitatearen metrika bera ez dela oso interesgarria, bezeroari etortzen zarenean “Gizona, % 37 neutroa duzu”, eta hala dio. , “ Aupa! Cool!" Horregatik, interesgarriagoa litzateke pixka bat urrunago joatea: sentimenduak ebaluatzetik zure produktuari buruz esaten dutenaren iritziak ebaluatzera.

Eta hori ere oso gauza interesgarria da, zeren... Pertsonalki uste dut printzipioz ezin dela mezu neutrorik egon, zeren eta pertsona batek espazio publikoan zerbait idazten badu, mezu hori nolabait koloreztatuta dagoelako. Pertsonalki ez dut inoiz ikusi marka bat aipatzen duen mezu neutrorik. Normalean zikinkeria mota bat izaten da.

Mezu hauetako kopuru handi bat hartzen badugu (milioika izan daitezke, 10 milioi), mezu bakoitzeko ideia nagusia nabarmendu, konbinatu, nahiko fidagarri ulertuko dugu jendeak marka honi buruz zer esaten duen, zer pentsatzen duen. "Ez zait ontziratzea gustatzen", "Ez zait koherentzia gustatzen" eta abar.

Zer uste du jendeak Transaero, Chupa Chups eta Estatu Batuetako presidenteaz?

Adibide dibertigarri bat daukat: sare sozialetako erabiltzaileek Transaero enpresarekin porrotaren ostean egingo luketenari buruzko infografia bat da.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Adibide interesgarri asko daude bertan: erre, hil, Europara erbesteratu, %2 ere idatzi zuten: "Bidali Siriara operazio militarretarako". Gauza dibertigarritik aurrera, ia edozein marka izan liteke - nire txakurren janaririk gogokoena hasita auto batzuetara. Paketatzea gustatzen ez zaionari, benetako gauzak gustatzen ez zaizkionak - beti egin dezakezu lan honekin, beti izan dezakezu hau kontuan. Adibide ugari daude jendeak ia bere produktuen ekoizpena aldatu zuenean sare sozialetan idatzi zutelako Chupa Chups ez zela nahikoa biribila edo ez zela nahiko gozoa.

Bada beste adibide dibertigarri bat. Asmatu zein iruzkin eta nori buruz?

Arthur Khachuyan: "Benetako Big Data publizitatean"

Zerbaitegatik, orain iritzien azterketa, mezuetatik ateratako gertaeren azterketa, ez da oso erabilia eta ez dago oso hedatuta. Teknologia hau super sekretua ez den arren, honetan ia ez dago inolako ezagutzarik, jendearen iruzkinetatik, subjektua atera, predikatu eta taldekatzeak ez baitu hizkuntzalaritza konputazionalean jeinurik behar. Ez da hain zaila egitea. Baina espero dut hurrengo bi urteetan jendea hau erabiltzen hastea, zeren... Polita izango da - hau da, hain automatikoa den feedbacka! Beti dakizu zer esaten duten zutaz. Beno, ulertzen duzu hori AEBetako presidenteari buruz egin zela.

Entzuleen galdera bati erantzuna:

  • Bai, hau ingelesez Facebook da. Hemen errusierara itzulita daude. Hau nonbait idatzita zegoen.

Big Data eta teknologia politikoak

Izan ere, Trumpi eta beste guztiei buruzko politikaren adibide interesgarri asko ditut, baina hona ez ekartzea erabaki genuen. Baina bada adibide politiko bat.

Estatuko Dumarako hauteskundeak dira. Noiz zinen? Lehengo urtean? Duela ia urte eta erdi.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Hona hemen euren kokapen zehatza, geopuntu jakin bateraino, zein hauteskunde barrutitan erortzen diren ulertzeko gai izan diren pertsonak. Eta orduan pertsona horietatik beren iritzi zehatza adierazten zutenak bakarrik hartzen ziren, bozkatuko zutenak.

Teknologia politikoaren ikuspuntutik, hori ez da oso zuzena, hau guztia populazio-dentsitatearen arabera normalizatu behar delako eta abar. Dena den, hemengo urdinek badakizu nori bozkatuko diote, gorriek oposizioko kideei bozkatuko diete, bide batez, ez ziren asko.

Pertsonalki uste dut Big Data ez dela teknologia politikoetara iritsiko laster, baina, aukera gisa, hautagaia marka ere bada. Eta hori ere, neurri batean, zure markaren inguruko gertakari eta iritzien analisia da, eta gauza nahiko interesgarria, denbora errealean ulertu dezakezulako nork zer egiten duen. BBCren hainbat kasu ezagutzen ditut, emisio batzuetan sare sozialak denbora errealean kontrolatu zituztenean: halako erantzuna zegoen, jendeak horri buruz idazten du, halako galderak egiten ditu, eta bikaina da! Oso laster erabiliko dela uste dut, guztiontzat interesgarria delako.

Marken posizioak modelatzea

Arthur Khachuyan: "Benetako Big Data publizitatean"

Ondoren, markaren posizioen modelizazioa daukat. Markak hainbat neurketa erabiliz (ez sare sozialetako harpidedunen gustukoak, baizik eta neurketa konplexuak erabiliz, edukiarekiko interesa, neurgailuak jasotzen emandako denbora) nola sailkatu ditzakezun buruzko zati txiki eta laburra.

Arthur Khachuyan: "Benetako Big Data publizitatean"

"Pharma" adibide bat dut arrazoi jakin batengatik. Hemen zirkulu txikiak barnekoak dira, distiratsuak - markak berak sortzen duen testu-eduki kopurua da, zirkulu handia markak berak sortzen duen argazki- eta bideo-eduki kopurua da.

Zentroarekiko hurbiltasunak ikusleentzat edukia zein interesgarria den erakusten du. Eredu handi bat dago, era guztietako parametro mordoa daude: gustukoak, birbidalketak, erantzun denbora, nork partekatu zuen batez beste... Hemen ikus dezakezue: “Kagotsel” zoragarri bat dago, eta horrek izugarri ematen du. dirua bere edukia sortzeko, eta horregatik erdigunetik nahiko gertu daude. Eta badaude kamaradak ere euren edukiak sortzen dituztenak, baina publikoari ez zaio interesatzen. Ez da oso adibide egokia, kontu hauek guztiak ia hilda daudelako.

Yegor Creed Basta baino gehiago maite da

Arthur Khachuyan: "Benetako Big Data publizitatean"

Tamalez, gainerakoak... zer erakutsi... Tira, errusiar rap-ak ere badaude, aukeran, benetako konpainietakoak.

Zein da plusa? Kontua da enpresa batek ia edozer jar dezakeela horrelako eredu batean, zure markaren alde lan egiten duten harpidedunen batez besteko soldatatik hasita; gustuko duten edozein eredu. Publizitate agentzia bakoitzak bere neurriak modu ezberdinean kalkulatzen dituenez, markek modu ezberdinean kalkulatzen dituzte euren neurriak.

Hemen ere badago bat - Basta, eduki kopuru handia sortzen duena, baina periferian kokatuta dagoena, eduki hori itxuraz ez baita oso interesgarria ikusleentzat. Berriz ere, ez dut uste epaitzeko. Baina, hala ere, badago Yegor Creed, sare sozialen arabera, ia gure garaiko interprete onena dena, baina bere argazki pertsonalak soilik argitaratzen dituena. Hala ere, harpidedun ugari ditu: nonbait milioi bat inguru daude. Ez dut kopuru zehatza gogoratzen; Gogoratzen dut pertsona horien konpromiso-portzentajea %85 baino askoz handiagoa dela, hau da, milioi harpidedun bakoitzeko 850 mila erantzun jasotzen dituela benetako pertsona horiengandik - hau benetako eromena da. Hau egia da.

Arthur Khachuyan: "Benetako Big Data publizitatean"

Entzuleen galderei erantzunak:

Zenbat denbora behar izan da rapper analisi eredua sortzeko?

  • Bakoitzak bere xede-publikoa du, pertsona hauen interesak bakoitzarentzat kalkulatzen dira... Hori guztia erdigunearekiko distantziara normalizatuta dago gutxi gorabehera, haien posizio erradiala ez da garrantzitsua (hemen edertasunagatik zikintzen da, horrela egin dezaten). ez elkarren aurka topo egin). Erdigunearekiko gutxi gorabeherako hurbiltasuna baino ez da garrantzitsua. Hau da erabiltzen dugun eredua. Adibidez, zirkulua hobeto gustatzen zait, batzuek gogoan egiten dute zirkuluerdi gisa.
  • Eredu hau azkar bildu zen, bizpahiru ordutan (bai, pertsona bat). Hemen neurketak baino ez ziren txertatzen: zer biderkatzen dugun zerekin, batu eta gero nolabait normalizatu. Ereduaren araberakoa. Bada jendea harpidedunen batez besteko soldata (hau ez da txantxa) interesatzen zaiona. Eta horretarako euren kontaktuak aurkitu behar dituzu, Avito, dena kalkulatu, biderkatu. Gertatzen da hori kontuan hartzeko denbora asko behar dela, baina zehazki hau (aurreko diapositiba seinalatzen du) - hemen parametroak oso sinpleak dira: harpidedunak, birbidalketak, eta abar. Bi edo hiru ordu inguru behar izan zituen osatzeko. Horren arabera, gauza hau denbora errealean eguneratzen da eta erabil dezakezu.

Orain parte dibertigarria dator. Adibideekin amaitu dut, ez baita interesgarria denbora luzez bakarrik hitz egitea. Eta espero dut orain galderak egingo dituzula, eta, egia esan, gai batetik bestera pasako gara, teknologiak nola erabil daitezkeen eta abar bezalako adibideak baditut eta...

Entzuleen galderei erantzunak:

  • Kasu pertsonal bakarra nuen, nolabait esateko, “kasinotik gertu”, kamera bat jartzen zenean, aurpegiak ezagutzen ziren, etab. Aitortutako pertsonen ehunekoa nahiko handia da, zalantzarik gabe, bai gurea, bai gure lehiakideak. Baina egia esan nahiko interesgarria da. Gauza interesgarri bat ikusten dut: pertsona horiek nortzuk diren uler dezakezu eta nahiko ondo iragar dezakezu zergatik etorri diren zehazki hona, zer aldatu den hainbeste euren bizitzan kasinora etortzea erabaki duten. Baina negozio mota espezifikoei dagokienez... Farmazia batean horrelako gauza bat jartzen baduzu, ez da ezertarako balio - ezin duzu aurreikusi zergatik etorri den pertsona bat farmaziara.

    Hemen zeregin globala eredu bat eraikitzea zen, pertsona batek zure markarekin interesa izan nahi duenean ulertzeko, horrela publizitatea eman diezaiokezu zerbait erosi ondoren (orain gertatzen ari den bezala), baizik eta publizitatea eman diezaiozun. iragarpenean” hau guztia noiz gertatuko den. Interesgarria zen halako “gero-kasino” batekin; pertsona horien ehuneko interesgarri bat izan zen - zergatik: norbaitek bat-batean promozio bat jaso zuen, beste norbaitek beste zerbait lortu zuen - halako ikuspegi interesgarriak. Baina denda batzuekin, txikizkako merkataritzarekin, pilulen moduko denda batekin, iruditzen zait ez dela oso zuzena izango.

Big Data lineaz kanpo erabiltzen al da?

  • Lineaz kanpo zegoen. Zehazki, gutxi gorabehera, eredu hau egokituko den edo ez ulertu behar duzu. Berriz ere, ur txinpartatsuarekin... Egia esan, dena interesatzen zait, baina pertsonalki ez dut ulertzen zenbaterainokoa den, nola pertsona horien profilak, haien jokaera, botila-ura erosi nahi dutenean. Hau egia izan daitekeen arren, ez dakit.

Zenbat sare sozial irekitako kontu daude?

  • Zehazki 11 sare sozial ditugu: "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagram" eta gauza txiki batzuk (zerrenda begiratu dezaket, "Mail.ru" eta abar bezalakoak) . VKontakte-n, zalantzarik gabe, adiskide horien guztien kopia dugu. Jendea dugu VKontakte-n - inoiz existitu diren guztietatik 430 milioi dira (horietatik 200 milioi inguru etengabe aktibo daude); taldeak daude, badaude loturak pertsona horien artean eta badaude interesatzen zaizkigun edukiak (testua), eta komunikabideen zati bat, baina oso txikia... Gutxi gorabehera, irudi honi begiratzen diogu: hor aurpegiak badaude, guk gorde itzazu, meme bat badago, gordetzen ditugu. Ez dugu gordetzen, guk ere ez genukeelako nahikoa eduki multimedia gordetzeko.

    Errusierazko Facebook bat dago. Nonbait orain %60-80 Odnoklassniki dira, hilabete pare batean ziurrenik denak amaieraraino iritsiko ditugu. Errusiako Instagram. Sare sozial guzti hauetarako taldeak, pertsonak, haien arteko loturak eta testua daude.

  • 400 milioi pertsona inguru. Sotiltasun bat dago: hiria zehazten ez duten pertsonak daude (potentzialki errusiarrak / ez-errusiak dira); Horietatik, sare sozialen batez bestekoa VKontakte-n itxitako kontuen % 14 da, ez dakit zifra zehatza Facebooken.
  • Instagram-en ere ez dugu komunikabiderik gordetzen, aurpegiak badaude soilik. Ez dugu halako (beste) eduki multimedia gordetzen. Normalean interesgarriak: testua soilik, pertsonen arteko loturak; Denak. Instagramen egiten den ikerketa ohikoena audientziari buruzko ohiko ikerketa da: pertsona horiek nortzuk diren, eta, batez ere, pertsona horiek beste sare sozialekin duten lotura. Aurkitu pertsona honen profila Vkontakte eta Facebook-en bere adina kalkulatzeko eta abar.
  • Oraindik ez dago beste guztiak hartu beharrik, bezerorik ez dagoelako besterik gabe. Hizkuntzari dagokionez: errusiera, ingelesa, gaztelania dugu, baina hala ere Errusiatik datozen marketarako soilik erabiltzen da; ba, edo Errusiatik ekartzen dituzten konpainiek.
  • Jendea elkarrizketatzen dugu egunero hari asko, asko eta askotan: datuak biltzen ditugu weba bilduz, eta adierazle hauek Api erabiliz eguneratzen ditugu. 2-3 egunetan "VKontakte" osoa zeharkatu dezakezu, haiek zeharkatuz; Astebete inguru Facebook-en osorik pasa dezakezu, nork eguneratu duen zer eta zer ez ulertuz. Eta gero berriro elkartu pertsona hauek bereizita: zer aldatu den zehazki, idatzi istorio hau guztia. Nire esperientziaren arabera, oso gutxitan erabili da norbaiten sare sozialetako profil zaharra benetako negozio helburuetarako. Pertsona politiko batek aurkeztu zuen garaia zen, eta bere egitekoa zen ulertzea zer nolako jendea etortzen den egoitzara, nortzuk ziren pertsona horiek duela 6-8 hilabete (profila ezabatu zuten, baina, egia esan, beste hautagai bati, bozkak iritsi ziren? hondatu).

    Eta pare bat aldiz - istorio pertsonalak norbaiten argazkiak domeinu publikoan argitaratu zirenean. Beharrezkoa zen konexioak aurkitzea, etab. Tamalez, pena da, baina ezin dugu epaitegian deklaratu, gure datu-basea legez likidorik gabe dagoelako.

  • MongoDB biltegiratzea nire gogokoena da.

Sare sozialak datu bilketaren aurka borrokatzen saiatzen ari dira

  • Normalean iragarleei kontu horien zerrenda bat bakarrik igotzen dugu, eta gero estandarra erabiltzen dute... Hau da, sare sozialetan, VKontakte-n, pertsona horien zerrenda zehaztu dezakezu.

    Baina Facebookek erositako cookieak erabiltzen ditu. Guk ez dugu cookieekin lan egiten, baina hainbat istorio egon ziren iragarleak berak pertsona batzuei eman zienean, haiekin elkarreraginean aritu ginen - sare hauek dituzte, teaser, teaser ez den publizitatearekin, "cookie" hauek. Lotu dezakezu - zalantzarik gabe! Baina gauza hau ez zait asko gustatzen, ez baitut uste oso benetakoa denik. Hau da nire ustez, TNS bezalakoa da, telebistak “jarraitzen” dituena - ez dago argi telebista hau ikusten ari zaren ala ez, ontziak garbitzen ari zaren telebista piztuta dagoen bitartean... Eta hemen ere berdina da. : Askotan Googlen sartzen dut zerbait Interneten, baina horrek ez du esan nahi erosi nahi dudanik.

  • Testuinguruko publizitate-sare estandarren bat erabiltzen ari bazara: hainbat istorio izan nituen pertsona horiek haiei deskargatu eta, haien interfazeak erabiliz, haien guneetako "cookie"ekin konektatzen saiatu ginenean. Baina horrelakoak ez zaizkit asko gustatzen.

Interneteko erabiltzaile baten soldata kalkulatzeko formula

  • Batez besteko soldataren formula orokorra: hau da pertsona bat bizi den eskualdea, hau da lan egiten duen negozio-kategoria (hau da, bere enplegatzailea den enpresa), orduan enpresa honetan duen posizioa hartzen da, batez bestekoa. Kargu honetarako soldata estimatzen da... "Head Hunter" eta "Superjob"-etatik (eta beste hainbat iturri daude) hartutako batez besteko soldata eskualde jakin bateko lanpostu huts baterako eta negozio-testuinguru jakin baterako.

    "Avito" eta "Avto.ru" parametro gehigarriak hartu ohi dira pertsona batek telefonoa argiztatu badu. Avito-rekin pertsona batek zer nolako gauzak saltzen dituen ikus dezakezu: garestiak, merkeak, erabiliak, erabiltzen ez direnak. "Avto.ru"-rekin ikus dezakezu auto bat duen ala ez - bere jabea da, ez da jabea. Telefonoa ustekabean nonbait erori duten pertsonen % 20 baino gutxiago da hau, eta kontua datu honekin lotu daiteke.

Zein bolumen jarduten du datuak biltzeko enpresak?

  • Petabytetan gordetako argazkien bolumena 6,4 da. Ezin dut orain zehazki esan hazkunde-tasa, 2016an “periskopioak” grabatzen hasi eta bideoa grabatzen hasi ginen eta.

    Ezin dut esan zehazki noiz zen zero. Enpresaz enpresa mugitu ginen - istorio luzeak dira horiek guztiak. Baina esan dezaket VK, Facebook, Instagram eta Twitter - negozio hori guztia (pertsonak, taldeak eta haien arteko konexioak) testua eta edukia duena - ez dela datu asko, litekeena da petabyte bat ere nahikoa izatea. Uste dut 700 gigabyte direla, ziurrenik 800.

Laguntzen al diezu bezeroei egungo nitxoa zehazten eta non zulatu?

  • Bezero bat etortzen denean, horrelako gauzak iradokitzen dizkiogu, baina guk geuk, Google Trendsek bezala, ez dugu horrelakorik egiten.
  • Hainbat istorio ia soziologikoak izan genituen, hauteskunde-aurreko historiarekin, dena aztertu genuen. Markekin eta markei buruzko iritziak baloratuz, ia beti ados dago dena. Hona hemen hauteskunde-hauteskunde istorioak - ez (hautagaiak irabazi behar duen ebaluatuz). Ez dakit nor dagoen gaizki hemen: gu, edo VTsIOMn pentsatzen dutenek.
  • Normalean markatik bertatik hartzen ditugu kontrol-emaitza hauek, ikerketak agintzen dituzten lagunengandik hartzen dituzte -telefono-ikerketak, marketin-ikerketak, etab. Gainera, hori guztia oinarrizko gauzekin egiazta daiteke: norbaitek posta-zerrendari erantzun zion, norbaitek inkestak egin... Marka handia bada (Coca-Cola, adibidez), zalantzarik gabe, bezeroen barne berrikuspen milioi bat edo bi dituzte. – ez dira sare sozialetako iruzkinak eta iritzi batzuk soilik; Hauek barne sistema, berrikuspen eta abar mota batzuk dira.

Legeak ez daki datu pertsonalak zer diren!

  • Datu iturri irekiak soilik aztertzen ditugu eta inoiz ez dugu inolako trikimailu zikinetan parte hartzen. Gure eredua datu ireki guztiak datu-zentro publiko batzuetan gordetzen ditugula, beste nonbait alokatzen ditugu eta etxean, gure bulegoetan, gure zerbitzarietan aztertzen ditugu eta ez doa lurraldetik kanpo inora.

    Baina datu irekien arloan gure legedia oso lausoa da.

    Ez dugu argi ulertzen zer diren datu irekiak, zer datu pertsonalak - 152. Lege Federal hau dago, baina hala ere... Nola zenbatzen dira? Orain, zure izena eta zure telefono-zenbakia datu-base batean baditut, beste datu-base batean zure telefono zenbakia eta zure e-maila, hirugarren batean, esate baterako, zure e-maila eta zure autoa; Hau guztia datu ez pertsonalak dirudi. Hori guztia batuta, badirudi legearen arabera datu pertsonal bihurtuko direla.

    Bi modutara moldatzen gara. Lehenengoa bezeroarentzako softwarea duen zerbitzari bat instalatzea da, eta gero datu horiek ez dira bere lurraldetik haratago joaten, eta gero bezeroa arduratzen da datu pertsonal horien banaketaz, datu ez pertsonalak, etab. Edo bigarren aukera: sare sozial bat edo beste zerbait auzitara eraman behar duzun istorioren bat bada...

    Halako azterketa bat egin genuen Lifenews-erako (Errusia Batuko primarioak zeuden) adiskide horien kontuak bildu eta zer-nolako pornoa gustatzen zitzaien aztertu genuenean. Gauza barregarria zen, baina hala ere. Hau gure iritzi pertsonal gisa saltzen dugu, aztertutakoa dokumentuetan legez ezagutarazi gabe –Pertsona Juridikoen Estatu Batuko Erregistroa, soldatak, sare sozialak–; Adituen iritzia saltzen dugu, eta, ondoren, alboan pertsonari zer aztertu eta nola azaltzen diogu.
    Hainbat istorio zeuden, baina merkataritza-proiektu publiko batzuekin lotuta zeuden. Esaterako, doako irabazi-asmorik gabeko proiektu bat dugu longboardetan ibiltzen direnentzat (halako taulak luzeak dira): zeregina jendearen argitalpenak biltzea zen - norbaitek "Gorki parkera joan nintzen ibiltzera" argitaratzen duenean. Eta orain mapan sartu beharko luke, eta bere ingurukoek norbait gertu dagoela ikus dezakete. VK-k buru-belarri ibili zigun gai honi buruz denbora luzez, ez zitzaien gustatu informazio hori jendearen baimenik gabe argitaratzea. Baina gero kontua ez zen epaitegietara heldu, hainbat erkidego handiren baitan arauei gehitu genien datuak hirugarrenek, agentziek, enpresek, analisiek, etab. erabil zitezkeela... Noski, ez zen bereziki etikoa izan, baina hala ere.

  • Garaiz konturatu ginen eta gure adituen iritzia denei saltzen hasi ginen.

Lan egiten al duzu hezkuntza erakundeekin?

  • Hezkuntza erakundeekin elkarlanean aritzen gara, bai. Eskaintza oso bat dugu: master programa bat dugu Goi Eskolan, eta beste unibertsitate batzuekin elkarlanean aritzen gara. Unibertsitateak asko maite ditugu!
  • Nire kontaktuak badituzu, idatzi didazu. Eta aurkezpenerako esteka, norbait interesatuta badago - adibide hauek guztiak hor daude, mugitu dezakezu.
  • Telefono-zenbakia, posta ezagutzen baduzu - ia ehuneko ehuneko aukera da, inork ez du kenduko. Telefono-zenbakirik ez badago, argazki bat izan ohi da; argazkirik ez badago, urtea, bizilekua, lana da. Hau da, urtez, bizilekuz eta lanaz, ia denak beti nahiko sotil identifikatu daitezke. Baina hau, berriz, zereginari buruzko galdera bat da.

    Badugu, demagun, Interneteko telebista saltzen duen bezero bat. Norbaitek "Games of Thrones" hauetarako harpidetza bat erosi die, eta zeregina bere CRM erabiltzea da pertsona horiek sare sozialetan aurkitzeko, eta gero beren eragin-eremuko balizkoak aurkitzea. Esan nahi dut, esate baterako, izen-abizenak eta helbide elektronikoa dituztela... Eta gero oso zaila da ezer egitea. Kasu gehienetan, jendea posta elektronikoz aurki daiteke.

  • Gure lagunen osaeraren arabera, normalean sare sozialetan jendea "parekatzen" dugu, baina hori ez da beti zuzena. Ez da beti egokia ez dela, ez du beti funtzionatzen. Lehenik eta behin, lan handia eskatzen du horrek, eragiketa hau (pertsona bat etortzea) lehenik eta behin lagun bakoitzari egin beharko zaiolako -sare sozialetatik etorritako ala ez ulertzeko-. Eta gero, edonorentzat ezezaguna da VKontakte-n lagun berdinak ditugula, Facebook-en lagun desberdinak ditugula. Ez guztiontzat, baina niretzat, adibidez, horrelakoa da; eta hori egia da jende gehienarentzat ere.

Nola biltzen da daturik osatuena?

  • Bere aldean bezeroarentzat softwarea instalatzea. Horietan zerbitzari bat instalatuta dago, eta datu publikoak soilik hartzen dizkigu, eta haien datu pertsonalak barnean prozesatzen ditu. NDA bat egiten da bezeroarekin. Hori, noski, ez da oso zuzena hori transferitzen digutela, baina legezko erantzukizuna bezeroarena da - tira, hau da, harentzat softwarea instalatzea edo datu anonimoak transferitzea. Baina hori oso arraroa zen, zeren –anonimizazio zuzena edo okerra– kasu gehienetan pertsona horien arteko menpekotasuna galtzen baita.

Nork erosten du aurpegia ezagutzeko softwarea?

  • Egia esan, hona goaz, saltzen dugun gure software nagusia aurpegien bilaketa, korrelazio analisia delako eta gobernu agentziei saltzen diegu. Eta duela urte eta erdi, istorio horiek guztiak publizitatean, marketinean, merkatu publikoan jarriko genituela erabaki genuen; horrela sortu zen Social Data Hub, merkataritzako entitate juridiko bat. Eta orain hona etortzen gara. Urte eta erdi daramatzagu hemen ibiltzen, jendeari azaldu nahian ez dagoela jendeari aipamen batekin deskargatu beharrik, galderei erantzunak eman behar zaizkiela, ez dagoela tonalitaterik behar. , eta abar. Beraz, zaila da non esatea...
  • (Nori esan nahi diozu?) Terrorista eta pederasta bilatu behar dituzten burkide guztiei.
    Berehala esan dezaket (hau izango da hurrengo galdera): gure datuen arabera, ez zuten irakaslerik espetxeratu berriro argitaratzeagatik.
  • VKontakte-n -% 14; Facebook-en ez dago profil itxirik (lagunen zerrenda itxia dago, eta abar). Eta interesgarriena mezu bat idatzi berri dudala da, orain zenbatu eta esango dute.

Ez argitaratu lotsatuko zaren zerbait!

  • Ez argitaratu lotsatuko zaituen ezer sare sozialetan - pertsonalki hau jarraitzen dut. Pertsonal asko banuen arren, Facebooken zin egiten dudalako. Tira, bazegoen eta bazegoen zer egin... Ez argitaratu lotsagarria izango zenik! Geroago Herri Ganbaran nonbait lan egingo baduzu, bai, hobe da komentariorik ez egitea. Ez baduzu hau egingo, orokorrean, inori ez zaio axola. Bakarrik ziurtatzen dizut inork ez duela zure gutun pertsonalik irakurtzen, eta hau guztia istorio hau guztia eraikitzen ari da...

    Astero, behin betiko norbait etortzen zait eta esaten dit: “Beno, nire lagunaren argazkiak orri publiko anonimo batera filtratzen ziren! Laguntza! Bide batez, inoiz ez argitaratu ezer orri publiko anonimoetan.

  • Ez dakit beste monitorizazio-sistemarik -hori ere kontuan hartuko dugu zalantzarik gabe, markaren aipamena negatiboa izan zela, Jainkoak barka nazazu... Baina esan dezaket estatu hurbileko burkide mota guztiak jendea bakarrik interesatzen zaiela. 5 milatik gorako audientzia dutenak, eta haien iritzi publikoak norbait eragin dezake.gero eragin. Nire esperientziaren arabera, ez da inoiz gertatu profilaren ebaluazioak agintzen dizkigun HR agentziak esatea: "Navalny gustatzen zaionari, ez kontratatu inor!"

Emaitzak argitaratzeari buruz. Zenbat pertsona ari dira lanean ikerketan?

  • 10 publizitate-enpresetatik zazpi argitaratzen ari dira orain. Zaila da esatea: duela urte eta erdi hasi ginenean... Hainbat pertsona ditugu arlo bakoitzean -bankuetan hainbat pertsona daude, HR-n hainbat pertsona, publizitatean hainbat pertsona. Eta orain pentsatzen ari gara norengana joatea errentagarriagoa den lehenengo, norentzat hasi behar dugun interfaze batzuk egiten...
  • (merkatuko segmentu bakoitzeko pertsona kopuruari buruz) 25 pertsona baino gehiago ez, ez genuelako inor bortxatu.
  • Orokorrean, printzipioz, merkatuko teknologia hauek %50 baino gehiago erabiltzen direla uste dut. Batzuk publizitate kanpainetan, beste batzuk barne-analisi moduko batean. Ehuneko 40k barne analitiketan erabiltzen duela esango nuke, %50-60ek markak amaitzeko saltzen duela. Baina hori dagoeneko publizitate-enpresen menpe dago. Ikusten duzu, batzuek gastatutako diruagatik, jartzen duten publizitateagatik, beste batzuek idazten dute, aldiz, zenbat jende ekarri duten, zein publiko mota... Hala esango nuke, baina oker egon naiteke, ez dut egia esan. imajinatu nola funtzionatzen duten burkide hauek guztiak. Datu kuantitatiboetan baino ez dakit.

Iragarki batzuk 🙂

Eskerrik asko gurekin geratzeagatik. Gustuko dituzu gure artikuluak? Eduki interesgarri gehiago ikusi nahi? Lagun iezaguzu eskaera bat eginez edo lagunei gomendatuz, Garatzaileentzako hodeiko VPS 4.99 $-tik aurrera, sarrera-mailako zerbitzarien analogo paregabea, guk zuretzat asmatu duguna: VPS (KVM) E5-2697 v3 (6 Nukleoak) 10GB DDR4 480GB SSD 1Gbps 19Gbps-ri buruzko egia osoa XNUMX $-tik edo zerbitzari bat nola partekatu? (RAID1 eta RAID10-ekin erabilgarri, 24 nukleoraino eta 40 GB DDR4 arte).

Dell R730xd 2 aldiz merkeagoa Amsterdameko Equinix Tier IV datu-zentroan? Hemen bakarrik 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 telebista 199 $-tik aurrera Herbehereetan! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99 $-tik aurrera! Irakurri buruz Nola eraiki azpiegitura korporazioa. klasea Dell R730xd E5-2650 v4 zerbitzarien erabilerarekin 9000 euroko balioa duten zentimo baten truke?

Iturria: www.habr.com

Gehitu iruzkin berria