Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Më 14 mars 2017, Arthur Khachuyan, CEO i Social Data Hub, foli në leksionin e BBDO. Arthur foli për monitorimin inteligjent, ndërtimin e modeleve të sjelljes, njohjen e përmbajtjes së fotografive dhe videove, si dhe mjete të tjera Social Data Hub dhe kërkime që ju lejojnë të synoni audiencën duke përdorur rrjetet sociale dhe teknologjitë e Big Data.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Arthur Khachuyan (në tekstin e mëtejmë - AH): - Përshëndetje! Pershendetje te gjitheve! Emri im është Arthur Khachuyan, unë drejtoj kompaninë Social Data Hub, dhe ne jemi të angazhuar në analiza të ndryshme intelektuale interesante të burimeve të hapura të të dhënave, fushave të informacionit dhe bëjmë të gjitha llojet e kërkimeve interesante e kështu me radhë.

Dhe sot kolegët nga BBDO Group na kërkuan të flasim për teknologji moderne për analizimin e të dhënave të mëdha, të dhëna të mëdha dhe jo aq të mëdha për reklamim: si përdoret, tregoni disa shembuj interesantë. Shpresoj se do të bëni pyetje gjatë rrugës, sepse mund të mërzitem dhe të mos zbuloj thelbin e kështu me radhë, kështu që mos u turpëroni.

Në fakt, drejtimet kryesore, ku janë përdorur ndonjëherë një lloj zgjidhjeje "afërsisht e të dhënave të mëdha", ato janë të gjitha të qarta - ky është shënjestrimi i audiencës, analiza, kryerja e një lloj kërkimi analitik të marketingut. Por është gjithmonë interesante se cilat të dhëna shtesë mund të gjenden, çfarë kuptimesh shtesë mund të gjenden pas aplikimit të analizës.

Pse na duhet teknologjia për reklamim?

Ku të fillojmë? Gjëja më e dukshme është reklamimi në rrjetet sociale. Sot e hoqa në mëngjes: për disa arsye VKontakte mendon se duhet ta shoh këtë reklamë të veçantë... Nëse është e mirë apo e keqe është pyetja e dytë. Shohim që unë patjetër i takoj kategorisë së rekrutëve:

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Gjëja e parë dhe më interesante që mund të merret si zgjidhje teknologjike... Gjëja e parë që doja të vendosja përpara se të fillojmë është të përcaktojmë termat: çfarë janë të dhënat e hapura dhe çfarë janë të dhënat e mëdha? Sepse të gjithë njerëzit kanë mirëkuptimin e tyre për këtë çështje dhe unë nuk dua t'i imponoj kushtet e mia askujt, por... Vetëm që të mos ketë mospërputhje.

Personalisht, mendoj se të dhënat e hapura janë gjithçka që mund të arrij pa asnjë hyrje ose fjalëkalim. Ky është një profil i hapur në rrjetet sociale, këto janë rezultatet e kërkimit, këto janë regjistra të hapur, etj. Të dhëna të mëdha, në kuptimin tim, unë i shoh kështu: nëse është një tabelë të dhënash, është një miliardë rreshta, nëse është një lloj e ruajtjes së skedarëve, është diku një petabajt të dhënash. Pjesa tjetër në terminologjinë time nuk janë të dhëna të mëdha, por diçka e tillë.

Profilizimi me saktësi të lartë dhe vlerësimi i profilit

Le të shkojmë me radhë. Gjëja e parë dhe më interesante që mund të arrini nga analizimi i burimeve të hapura të të dhënave është profilizimi me saktësi të lartë dhe vlerësimi i profilit. Çfarë është kjo? Kjo është një histori ku llogaria juaj e rrjetit social mund të parashikojë jo vetëm kush jeni, jo vetëm interesat tuaja.

Por tani, duke kombinuar burime të ndryshme, mund të kuptoni nivelin mesatar të pagës tuaj, sa kushton apartamenti juaj dhe ku ndodhet. Dhe të gjitha këto të dhëna mund të përdoren fjalë për fjalë nga mjetet e disponueshme. Për shembull, nëse merrni llogarinë tuaj në një rrjet social, shikoni, le të themi, ku jetoni, ku punoni; kuptoni se në cilin sektor të biznesit ndodhet kompania ku punoni; shkarkoni vende të lira të ngjashme nga HH dhe “Superjob” nëse jeni analist, menaxher, etj.; shikoni se ku jetoni (baza, të themi CIAN), kuptoni se sa kushton të marrësh me qira një shtëpi në këtë vend, sa kushton të blesh një shtëpi në këtë vend, parashikoni përafërsisht sa fitoni. Më tej, duke përdorur rrjetet tuaja sociale, mund të kuptoni se sa shumë udhëtoni, ku jeni dhe sa besnik jeni ndaj punëdhënësit tuaj.

Prandaj, nga një numër kaq i madh metrikash ne mund të bëjmë gjithçka që duam. Ne mund t'ju prezantojmë me një produkt që ju intereson. Mund ta imagjinoni një dyqan online? Ju shkoni atje - ky dyqan online kap llogarinë tuaj në një rrjet social dhe ju thotë: "Masha, sapo u ndave me të dashurin tënd, këtu janë disa produkte të caktuara për ty." Kjo nuk është e ardhmja e afërt...

Si përcaktohet gjeolokacioni i një personi?

Përgjigjet e pyetjeve nga audienca:

  • Në mënyrë tipike, 80% e të gjitha regjistrimeve konsiderohet të jetë vendi i saktë i banimit. Por për njerëzit që nuk bëjnë check-in askund, ka disa opsione: ose check-in, ose gjeolokacion, ose kjo është një analizë e postimeve dhe publikimeve për të gjithë periudhën kohore kur një person ka shkruar diçka... Dhe diku, do të shfaqet diçka si "Dua të blej një karrocë fëmijësh pranë Akademicheskaya" ose "Kohët e fundit pashë mbishkrime të shëmtuara në mur këtu". Kjo do të thotë, për pothuajse 80% të njerëzve, vendndodhja e tyre gjeografike, vendi i tyre i punës dhe vendbanimi i tyre mund të përcaktohet duke përdorur të dhëna ose meta të dhëna që mund të mblidhen nga rrjetet sociale.

    Kjo, përsëri, është një analizë e postimeve. Në kuptimin më të thjeshtë, kjo është një analizë e kontrolleve dhe vendndodhjeve në rrjetet sociale, të cilat nuk fshijnë metadatat jpeg (mund të kuptoni diçka prej tyre). Por për njerëzit e mbetur, këto janë zakonisht transmetime me tekst: ose një person "shkëlqen" vendndodhjen e tij kur shkruan për diçka, ose ai "shkëlqen" telefonin e tij, me anë të cilit mund të gjeni disa nga reklamat e tij në Avito ose llogarinë e tij në " Auto RU". Bazuar në këto të dhëna, ju mund të kombinoni (për shembull, "Unë po shes një makinë afër Mayakovskaya") dhe përafërsisht ta supozoni këtë.

  • Njerëzit zakonisht e postojnë këtë në mediat sociale. Ne punojmë vetëm me burime të hapura dhe këtu po flasim ekskluzivisht për burime të hapura. Zakonisht publikojnë reklama, pra në gjashtëdhjetë për qind të rasteve, historia më e zakonshme kur njerëzit “tregonin” numrin aktual të celularit janë reklamat për shitjen e diçkaje. Ose në disa grupe një person shkruan ("Unë shes këtë apo atë atje"), ose shkon diku.

    Po! Zakonisht komentojnë si: “Më përgjigjeni ose më dërgoni një SMS, telefononi numrin tim. Kjo ndodh shumë shpesh me njerëzit që shesin diçka, blejnë diçka në rrjetet sociale, komunikojnë me dikë... Prandaj, duke përdorur këtë numër mund të lidhni profilin e tij në CIAN me të, nëse ai ka publikuar ndonjëherë diçka, ose, përsëri, në Avito. Këto janë thjesht burimet më të njohura, kryesore, do të jetë më tej - këto janë Avito, CIAN dhe kështu me radhë.

  • Kjo i referohet një dyqani online. Tjetra do të jetë teknologjia e njohjes së fytyrës dhe përputhjes së profilit (ne do të flasim për të). Thjesht teorikisht, kjo mund të zbatohet në një dyqan offline. Dhe në përgjithësi, ëndrra ime e madhe është që kur shfaqen banderolat e rrugëve, kur kaloni pranë një kamere, ajo të "të bllokojë" fytyrën. Por ky rast do të ndalohet me ligj sepse është cenim i privatësisë. Shpresoj se do të ndodhë herët a vonë.
  • Nga përvoja personale. Shumë shpesh, kur një person ju shkruan diçka, ju operoni disa fakte nga jeta e tij që nuk duhet t'i dini... Njerëzit në shumicën e rasteve tremben. Por! Bazuar në statistikat e fundit, numri i llogarive të mbyllura në rrjetet sociale është ulur me 14%. Numri i falsifikimit po rritet, numri i llogarive të hapura po rritet - njerëzit po shkojnë gjithnjë e më shumë drejt hapjes. Mendoj se pas 3-4 vitesh ata do të pushojnë së reaguari aq fort ndaj faktit që dikush di për ta informacione që potencialisht nuk duhet t'i dinte. Por në fakt është shumë e lehtë për t'u marrë duke parë murin e tij.

Çfarë mund të merret nga burimet e hapura?

Ekziston një listë e përafërt e gjërave që mund të kuptohen me besueshmëri mjaft të lartë nga burimet e hapura. Në fakt, ka edhe më shumë metrika të ndryshme; varet nga klienti i një kërkimi të tillë. Ka disa agjenci HR që interesohen nëse shani në rrjetet sociale apo diku në hapësirë ​​publike. Dikush është i interesuar nëse ju pëlqejnë botimet e Navalny ose, anasjelltas, botimet e Rusisë së Bashkuar, ose ndonjë lloj përmbajtjeje pornografike - gjëra të tilla ndodhin mjaft shpesh.

Ato kryesore janë vlerat familjare, kostoja e përafërt e një apartamenti, shtëpie, kërkimi i një makine etj. Bazuar në këtë, njerëzit mund të ndahen në grupe shoqërore. Këta janë përdoruesit e Moscow Tinder, të cilët janë ata (sipas fotografive të tyre të gjetura në llogaritë e tyre në Facebook); Bazuar në interesat e tyre, ata ndahen në grupe të ndryshme shoqërore:

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Nëse i afrohemi reklamave, atëherë ngadalë jemi larguar nga synimi standard i reklamave, kur zgjidhni në VKontakte që jeni të interesuar për burra 18-vjeçarë të abonuar në grupe të caktuara. Unë kam këtë foto në vijim, do t'ju tregoj tani:

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Përfundimi është se shumica e shërbimeve aktuale që analizojnë, në parim, njerëzit që analizojnë rrjetet sociale, janë të angazhuar në analizimin e interesave... Gjëja e parë që u vjen në mendje njerëzve është të analizojnë grupet kryesore të abonentëve të tyre. Ndoshta kjo funksionon për disa, por personalisht mendoj se është thelbësisht e gabuar. Pse?

Pëlqimet tuaja mblidhen dhe analizohen

Tani merrni telefonat tuaj, shikoni grupet tuaja kryesore - patjetër do të ketë më shumë se 50% të grupeve që tashmë i keni harruar, kjo është një lloj përmbajtjeje që në të vërtetë është e parëndësishme për ju. Nuk e konsumoni fare, por megjithatë sistemi do t'ju gjurmojë sipas tyre: që jeni abonuar në receta, në disa grupe të njohura. Kjo do të thotë, ju do të shkelni sistemin që analizon profilin tuaj dhe interesat tuaja nuk do të justifikohen.

Duke vazhduar... Çfarë ka? Ne supozojmë se çfarë po bëjnë njerëzit e tjerë. Sipas mendimit tonë, mënyra më adekuate për të vlerësuar interesat e përdoruesve janë pëlqimet. Për shembull, në VKontakte nuk ka furnizim pëlqimesh dhe njerëzit mendojnë se askush nuk e di se çfarë u pëlqen. Po, disa nga pëlqimet futen në Instagram, ne shohim diçka në Facebook, por shumica e përmbajtjeve në grupe të caktuara nuk e transmetojnë këtë në një burim të përbashkët, dhe njerëzit jetojnë dhe mendojnë se askush nuk do ta dijë se çfarë u pëlqen.

Dhe duke mbledhur disa përmbajtje të një lloji që na intereson, duke mbledhur këto postime, duke mbledhur këto pëlqime, pastaj duke e kontrolluar këtë person duke përdorur këtë bazë të dhënash, ne mund të përcaktojmë me saktësi të lartë se kush është ai, cili është fati i tij, çfarë i intereson. Vendoseni atë pikërisht në një grup të caktuar shoqëror dhe ndërveproni me të.

Blerja e një makine ndryshon sjelljen

Unë kam një shembull të tillë. Unë do të bëj menjëherë një rezervë që shembujt e mi janë pothuajse reklamues dhe gati marketingu, sepse, e dini, shumica e rasteve mbrohen nga NDA e kështu me radhë. Por do të ketë ende shumë gjëra interesante. Pra, historia me këta njerëz: këta janë burra që blenë një makinë midis 2010 dhe 2015. Se si ka ndryshuar sjellja e tyre sociale në internet, tregohet nga ngjyra. Përqindja e vajzave në mesin e abonentëve ka ndryshuar, unë u pajtova në faqet publike "djaloshare", gjeta një partner seksual të përhershëm...

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

E gjithë kjo gjë ndahet sipas markës së makinës dhe numrit të njerëzve. Nga këtu mund të nxirrni shumë përfundime interesante për sjelljen e njerëzve dhe se si funksionon e gjithë kjo. Mund të them se Porsche Cayenne dhe Priora e mbjellë janë pothuajse identike për sa i përket numrit të audiencës së tërhequr. Cilësia e këtij audienca dhe sjellja e tyre janë të ndryshme, por sasia është afërsisht e njëjtë. Përfundimi që mund të nxirrni nga këtu është çfarëdo që dëshironi, më afër tregut tuaj. Nëse shisni një Audi, ju bëni sloganin "Blini një Audi dhe largohuni nga prindërit tuaj!" e kështu me radhë.

Po, ky është një shembull qesharak i faktit që sjellja e njerëzve në bazë të analizës së pëlqimeve, në bazë të cilit grup lëvizin, çfarë përmbajtje analizojnë - me një probabilitet gati 100% e bën të qartë se kush jeni. Sepse nëse nuk keni akses në trafikun e rrjetit dhe nuk lexoni mesazhe personale, pëlqimet do t'ju tregojnë gjithmonë se kush është ky person - një grua shtatzënë, një nënë, një ushtarak, një polic. Dhe për ju, si një person që mund të reklamoni, ky është një goditje e madhe në objektiv.

Përgjigjet e pyetjeve nga audienca:

  • Çdo kolonë është numri i njerëzve në këtë makinë; si kanë ndryshuar modelet e tyre të sjelljes. Shikoni: njerëzit që blenë një Porsche Cayenne - afërsisht 550 njerëz (të verdhë), përqindja e vajzave midis abonentëve është rritur.
  • Mostra janë përdoruesit e rrjeteve sociale "Vkontakte", "Facebook", "Instagram" nga 2010 deri në 2015. Sqarimi i vetëm: makinat e përzgjedhura këtu janë ato që mund të identifikohen në fotografi me më shumë se 80% saktësi duke përdorur mjete të caktuara.
  • Në një periudhë të caktuar, makina e tij (epo, jo e tij, ia lëmë rrjeteve sociale)... Gjatë një periudhe të caktuar, një person fotografohej vazhdimisht me makinën, ishte me të, publikimet. ishin të ndryshme, fotografitë ishin nga këndvështrime të ndryshme, e kështu me radhë. Më pas do të shfaqet një foto se cilët njerëz po fotografojnë me cilat vetura dhe... Po, kjo është pyetja e dytë - besimi në të dhënat e rrjeteve sociale.
  • Meqenëse ne e sollëm atë, për fat të keq, të dhënat e mediave sociale nuk janë gjithmonë të sakta. Njerëzit nuk janë gjithmonë të prirur të publikojnë informacionin e tyre. Personalisht, kam kryer një studim të tillë: kam krahasuar numrin e të diplomuarve në universitetet e Moskës me numrin e njerëzve të regjistruar në rrjetet sociale. Mesatarisht, 60% më shumë njerëz janë të regjistruar në rrjetet sociale - të diplomuar në Universitetin Shtetëror të Moskës në një vit të caktuar në specialitete të caktuara - sesa në parim. Pra, po - ka, natyrisht, një përqindje gabimesh këtu, dhe askush nuk e fsheh atë. Këtu thjesht marrim si bazë ato makina që mund të identifikohen me më shumë se 80% probabilitet.

Lista e burimeve për trajnimin e modeleve

Këtu është një listë mostër e burimeve që mund të përdoren, e cila përdoret për të përcaktuar me siguri të madhe profilin shoqëror të një personi, kush është ai.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Ne marrim një profil nga rrjetet sociale, nga CIAN - kostoja e një apartamenti është afërsisht, "Head-Hunter", "Superjob" - kjo është paga mesatare për një person të caktuar. Shpresoj që të mos ketë përfaqësues të Head Hunter këtu, sepse ata mendojnë se nuk është shumë mirë t'u merren këto të dhëna. Megjithatë, kjo është paga mesatare në rajone të caktuara për lloje të caktuara të aktiviteteve për vende të lira pune.

"Avito", "Avto.ru": shumë shpesh njerëzit, kur telefoni i tyre ndizet, ata patjetër e kanë atë (në një numër të madh rastesh) të paktën diçka në "Avito", ose në "Avto.ru", ose në një tjetër disa faqe nga të cilat mund të kuptoni se kush janë ata. Nëse në këtë numër telefoni është shitur një karrocë ose një makinë... Rosstat dhe Regjistri i Bashkuar Shtetëror i Personave Juridik janë akoma më shumë regjistra me ndihmën e të cilëve mund të renditni kompaninë punëdhënëse - sipas një formule, sipas një modeli që çdo person mund të vendosë (mund të përcaktosh përafërsisht paratë e këtij personi etj.).

Tinder ndihmon në mbledhjen e të dhënave për situatën e njerëzve

Plus, ka një gjë kaq interesante (përndryshe, është shumë qesharake në studim) - ky është, përsëri, mbledhja e të dhënave nga Moscow Tinder duke përdorur bots për këtë Tinder. U përcaktua distanca me njerëzit dhe më pas u përcaktua vendndodhja e tyre e përafërt.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Objektivi i këtij studimi ishte përcaktimi i numrit të llogarive të Tinder në territorin e institucioneve qeveritare - në Duma, në prokurori, e kështu me radhë. Por ti, si reklamues, mund të imagjinosh çfarë të duash: mund të jetë, për shembull, Starbucks ose dikush tjetër... Kjo do të thotë, numri i njerëzve në Tinder që pinë kafe nga ju, porosisin diçka, janë në dyqane. Në lidhje me këtë gjeolokacion: kjo mund të bëhet me çdo shërbim.

Përgjigjja e një pyetjeje nga auditori:

  • Tinder? Ti nuk e di? Tinder është një aplikacion takimesh ku shikoni fotot (majtas-djathtas) dhe ky aplikacion ju tregon distancën me personin. Nëse e merrni distancën nga ky person nga tre pika të ndryshme, mund të përcaktoni afërsisht (+ 5-7 metra) vendndodhjen. Në këtë rast, për përcaktimin në territorin e prokurorisë ose Dumës së Shtetit, nuk është aq e vështirë. Por përsëri, mund të jetë dyqani juaj, mund të jetë çdo gjë.

Për shembull, shumë kohë më parë kishim një rast të tillë (jo një studim), kur morëm nga një prej operatorëve celularë të dhëna për densitetin e trafikut, të dhëna për densitetin e lëvizjes së pikave celulare dhe i gjithë ky informacion u mbivendos. në koordinatat e tabelave të vendosura në autostrada . Dhe detyra e operatorit celular është të përcaktojë përafërsisht sa njerëz po kalojnë dhe mund ta shohin këtë reklamë billboard.

Nëse këtu ka specialistë të reklamave të tabelave, mund të thuash: është e pamundur të kuptosh me super besueshmëri - dikush po vjen, dikush nuk shikoi, dikush shikoi... Megjithatë, ky është një shembull se si ka 20 miliardë poligone të këto në Moskë, mbi të cilat është dendësia e këtyre njerëzve në çdo orë përgjatë rrugëve të caktuara... Ju mund të shihni se çfarë po kalonin këta njerëz në çdo moment dhe të vlerësoni përafërsisht fluksin e pasagjerëve.

Përgjigjja e një pyetjeje nga auditori:

  • Askush nuk jep të dhëna të tilla. Ne kryem një studim të tillë për një nga operatorët, ky është një histori ekskluzivisht e brendshme, kështu që, për fat të keq, nuk është paraqitur në formën e fotove. Por shpesh agjencitë e mëdha reklamuese nuk kanë probleme të kontaktojnë një operator. Të paktën në Moskë, ka shumë precedentë kur, për shembull, kompanitë e sigurimeve u drejtohen kompanive si GetTaxi, të cilat ofrojnë të dhëna jopersonale për moshën e shoferit, mënyrën se si ata ngasin (mirë - keq, pamatur - jo), për të parashikuar politikat e kështu me radhë. Të gjithë luftojnë me këtë, por në një nivel të brendshëm, duke dhënë të dhëna anonime - mendoj se askush nuk e ka një problem të tillë.

Njohja e imazhit dhe modelit

Shkoni përpara. I preferuari im është njohja e imazhit. Do të ketë një pjesë të vogël për kërkimin e njerëzve sipas fytyrave, por ne kryesisht nuk e marrim këtë pjesë. Ne marrim në mënyrë specifike njohjen e imazhit dhe përcaktimin e asaj që është në këtë imazh - marka e makinës, ngjyra e saj, etj.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Unë kam këtë shembull qesharak:

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Një studim i tillë ka pasur për kërkimin e tatuazheve në rrjete të ndryshme sociale. Prandaj, e njëjta gjë mund të zbatohet për çdo markë, për çdo imazh vizual, për pothuajse çdo imazh vizual. Ka nga ato që nuk mund të përcaktohen me besueshmëri (ne nuk i marrim ato).

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Këtu është e preferuara ime. Markat e makinave mjaft shpesh i drejtohen kësaj detyre, sepse detyra e tyre, për shembull, është të gjejnë të gjithë pronarët e disa BMW X6, të kuptojnë se cilët janë ata, si janë të lidhur me njëri-tjetrin, për çfarë u interesojnë, etj. Kjo ka të bëjë me pyetjen se me çfarë makinash fotografojnë njerëzit në rrjetet sociale.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Këtu nuk kishte fare filtrim: objekti ishte i tyre, makina nuk ishte e tyre; Është vetëm prishja e makinave - mosha e kështu me radhë. Por njohja vizuale e imazhit përdoret mjaft shpesh: ky është kërkimi për gratë shtatzëna dhe kërkimi i logove të markave në një lloj masmedia (kush poston çfarë).

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Rasti im i preferuar (i cili përdoret nga restorante të ndryshme): çfarë lloj rrotullash postohen në një rrjet social. Është një gjë qesharake, por në fakt ju lejon të kuptoni shumë gjëra interesante, së pari, për klientët tuaj: kush erdhën tek ju dhe pse e bënë atë. Sepse nuk është sekret që në baret e sushi-t, shumica e njerëzve (nuk do të them "vajza") bëjnë foto për të kontrolluar, për të fotografuar diçka, etj.

Marka mund të përfitojë nga kjo. Marka është e interesuar se çfarë lloj produktesh i duhen për të fotografuar dhe postuar bukur, çfarë lloj njerëzish erdhën atje. Kjo gjë mund të bëhet pothuajse me çdo gjë, që nga ushqimi.

Njohja e modelit të videos

Përgjigjja e një pyetjeje nga auditori:

  • Jo në video. E kemi në modalitetin e testimit. Ne e provuam këtë teknologji, por na rezulton se... Ajo njeh gjithçka me video mjaft mirë, por nuk kemi gjetur askund një aplikacion për të. Mirupafshim. Përveç analizës se sa dhe cilat video blogere po flasin diku... Ka pasur një studim të tillë. Sa prej fytyrave të tyre takohen, sa shpesh. Por markat ende nuk e kanë kuptuar se ku mund ta gjejnë këtë. Ndoshta një ditë do të vijë.

Përsëri, ky është ushqim, mund të jenë gra shtatzëna, burra (jo shtatzënë), makina - çdo gjë.

Si opsion, kishte një studim të Vitit të Ri për një media. Gjithashtu larg reklamave, por ende. Ja çfarë ushqimesh agjëruan njerëzit për Vitin e Ri:

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Këtu ndahet edhe sipas moshës. Mund të vërehet një korrelacion i tillë që të rinjtë kryesisht porosisin ushqime, të rriturit kryesisht bëjnë një tryezë tradicionale. Është një gjë qesharake, por duke e imagjinuar atë si një pronar marke, mund të vlerësoni një numër të madh gjërash: kush e trajton produktin tuaj dhe si, çfarë shkruajnë për të. Shpesh, njerëzit nuk e përmendin gjithmonë vetë markën në tekst dhe sistemet tradicionale të monitorimit analitik nuk mund ta kuptojnë dhe gjejnë gjithmonë këtë përmendje të markës vetëm sepse nuk përmendet në tekst. Ose teksti është shkruar gabimisht, nuk ka etiketa hash ose asgjë.

Fotot janë të dukshme. Me fotografinë, mund të dalloni nëse është subjekti qendror i kornizës apo jo subjekti qendror i kornizës. Atëherë mund të shihni se çfarë ka shkruar ky person. Por më shpesh përdoret si një kërkim për audiencë të mundshme që kanë ngarë makina të caktuara etj. Dhe pastaj do të bëjmë shumë gjëra interesante me këto makina.

Bots mësohen të imitojnë njerëzit

Kishte gjithashtu një mundësi të tillë për përdorimin e njerëzve duke numëruar:

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Ekziston një mundësi për të krahasuar njerëzit, kur duhet të gjeni njerëz duke përdorur disa fotografi, të kuptoni profilin e tyre social, kush janë ata. Përsëri, i kthehemi pyetjes se nëse kemi një aparat fotografik në një dyqan offline, atëherë kjo është një mënyrë mjaft e mirë për të kuptuar se kush vjen tek ju, kush janë këta njerëz, për çfarë u interesojnë, çfarë i shtyu ata të vijnë tek ju. .

Më pas vjen gjëja më interesante: nëse mbledhim llogaritë e tyre në rrjetet sociale, kuptojmë se cilët janë këta njerëz, për çfarë u intereson, ne mund (si opsion) të bëjmë një bot të ngjashëm me këta njerëz; ky bot do të fillojë të jetojë si këta njerëz dhe do të analizojë se çfarë reklamash sheh në rrjete të ndryshme sociale. Kjo do t'ju lejojë të kuptoni me saktësi se cilat marka i drejtohen këtij personi. Kjo është gjithashtu një histori mjaft e zakonshme kur ju duhet jo vetëm të analizoni se kush është ky person dhe çfarë interesash ka, por edhe çfarë lloj reklamimi duhet të synojnë konkurrentët tuaj të mundshëm ose persona të tjerë të interesuar.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Analiza e lidhjeve në rrjetet sociale

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Gjëja tjetër interesante është analiza e marrëdhënieve midis njerëzve. Në fakt, analiza e lidhjeve në rrjet, këto grafikë të rrjetit - nuk ka pak, asgjë të re në këtë, të gjithë e dinë këtë.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Por aplikimi për detyrat e reklamimit është më interesantja. Ky është një kërkim për njerëzit që vendosin tendenca, ky është një kërkim për njerëzit që shpërndajnë informacion sipas kritereve të caktuara brenda këtij rrjeti. Le të themi se jemi të interesuar për të njëjtët pronarë të një modeli të caktuar BMW. Duke i bashkuar të gjithë, ne mund të gjejmë ata që kontrollojnë opinionin publik. Këta nuk janë domosdoshmërisht blogerë të automobilave dhe kështu me radhë. Zakonisht këta janë shokë të thjeshtë që ulen në faqe të ndryshme publike, janë të interesuar për disa përmbajtje dhe munden, në një periudhë shumë të shkurtër kohore, të tërheqin markën tuaj ose dikë me interes për ju në këtë fushë të përgjegjësisë, në fushën e interesi.

Këtu është një shembull i tillë. Kemi disa njerëz potencialë, lidhje mes njerëzve. Këtu portokallitë janë njerëz, pikat e vogla janë grupe të zakonshme, miq të përbashkët.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Nëse i mbledh të gjitha këto lidhje mes tyre, mund të shohësh shumë qartë se ka njerëz që kanë një numër të madh grupesh të përbashkëta, miq të përbashkët, ata janë aty mes tyre... Dhe nëse i njëjti vizualizim ndahet në grupe sipas interesave, sipas përmbajtjes, që shpërndajnë, sa ndërveprojnë me njëri-tjetrin... Këtu mund të shihni se fotografia e mëparshme është bërë kështu:

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Këtu grupet dallohen qartë nga ngjyra. Në këtë rast, këta janë studentët tanë master në Shkollën e Lartë Ekonomike. Këtu mund të shihni se ato vjollcë/blu janë ata që i duan faqet publike të Transparency International, Open Russia dhe Khodorkovsky. Poshtë majtas janë të gjelbërt, ata që e duan Rusinë e Bashkuar.

Ju mund të shihni se fotografia e mëparshme ishte e tillë (këto janë vetëm lidhje midis njerëzve), por është bërë qartë e demarkuar. Domethënë, të gjithë njerëzit janë gjithmonë të lidhur me njëri-tjetrin, kanë të njëjtat interesa, janë miq me njëri-tjetrin. Ka disa sipër, të tjerë poshtë dhe disa shokë të tjerë atje. Dhe nëse secili prej këtyre nëngrafëve të vegjël vizualizohet veçmas me parametra të tjerë dhe shikon shpejtësinë e shpërndarjes së përmbajtjes (përafërsisht, kush riposton çfarë atje), mund të gjesh në secilën pjesë një ose dy njerëz që mbajnë gjithmonë opinionin publik në duart e tyre, duke ndërvepruar me të cilin, duke kërkuar dërgoni një lloj postimi ose diçka tjetër - mund të merrni një përgjigje nga e gjithë kjo audiencë interesante.

Unë kam një shembull tjetër të tillë. Gjithashtu një grafik: këta janë punonjës të BBDO Group që gjenden në rrjetet sociale si shembull. Duket jo interesante, e madhe, e gjelbër, lidhjet mes tyre...

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Por unë kam një opsion ku grupet janë ndërtuar tashmë mes tyre. Pastaj, nëse dikush është i interesuar, ekziston një version interaktiv - mund të klikoni dhe të shikoni.

Sipër djathtas janë ata që e duan Putinin. Këtu vjollcat janë dizajnerët; ata që janë të interesuar për dizajn, diçka interesante, etj. Këtu gjërat e bardha janë ekipi drejtues (me sa duket, siç e kuptoj); Këta janë njerëz që, në përgjithësi, nuk janë të lidhur në asnjë mënyrë, por punojnë afërsisht në të njëjtat pozicione. Pjesa tjetër janë grupet e tyre të përbashkëta, lidhjet, e kështu me radhë.

Markat nuk kanë nevojë për blogerë, por për opinionistë

Ne i marrim këta njerëz dhe i gjejmë - atëherë agjencia e reklamave, kompania e reklamave vendos vetë: mund t'i japë para këtij personi në mënyrë që ai të ndërveprojë disi me këtë përmbajtje, diçka tjetër, ose t'u drejtojë atyre fushatën e tij specifike reklamuese. Kjo përdoret gjithashtu mjaft shpesh, veçanërisht tani, sepse të gjitha markat duan të punojnë me blogerët, duan që përmbajtja e tyre të promovohet, por agjencitë e reklamave nuk duan vërtet të kontaktojnë (epo, kjo ndodh).

Dhe mënyra e vërtetë për të dalë nga kjo situatë është të gjesh njerëz që nuk janë blogerë, jo blogerë bukurie, por për shembull, disa qenie të vërteta që ndërveprojnë me këtë markë, të cilët mund të shkruajnë në një faqe të mjerë publike "Përgjigjet e Mail.ru". një numër të caktuar shikimesh. Këta njerëz, të cilët janë vazhdimisht të interesuar për përmbajtjen e këtij personi, do të përhapin të gjithë, dhe marka do të përfshihet.

Opsioni i dytë për përdorimin e një teknologjie të tillë tani është mjaft i rëndësishëm - kërkimi i bots, i preferuari im. Ky është një rrezik reputacioni për konkurrentët tuaj dhe një mundësi për të hequr njerëzit e parëndësishëm nga një fushatë reklamimi, dhe çdo gjë tjetër (fshirja e komenteve dhe kërkimi i lidhjeve midis njerëzve). Unë kam një shembull të tillë, ai është gjithashtu i madh dhe ndërveprues - mund ta lëvizni. Këto janë lidhje të njerëzve që kanë shkruar komente në komunitetin Lentach.

Ky shembull është në mënyrë që të kuptoni se sa mirë dhe lehtësisht të dukshëm janë robotët; dhe për këtë nuk keni nevojë të keni njohuri teknike. Kjo do të thotë se “Lentach” publikoi një postim në lidhje me hetimin e FBK-së për Dmitry Medvedev, dhe disa njerëz filluan të shkruanin komente. Ne mblodhëm të gjithë njerëzit që shkruan komente - këta njerëz janë të gjelbër. Tani do ta zhvendos:

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Njerëzit janë të gjelbërt (që kanë shkruar komentet). Ata janë këtu, ata janë këtu. Pikat blu mes tyre janë grupet e tyre të përbashkëta, pikat e verdha janë abonentët, miqtë e tyre të zakonshëm etj. Pjesa më e madhe e njerëzve janë të lidhur me njëri-tjetrin. Sepse, cilado qoftë teoria e tre, katër, pesë shtrëngimeve duarsh, të gjithë njerëzit janë të lidhur me njëri-tjetrin në rrjetet sociale. Nuk ka njerëz që ndahen nga njëri-tjetri. Edhe miqtë e mi social fobikë që përdorin VKontakte ekskluzivisht për të parë video janë ende të abonuar në disa nga të njëjtat faqe publike si ne.

Navalny përdor gjithashtu robotë. Të gjithë kanë bots

Pjesa më e madhe e njerëzve (këtu është, këtu) janë të lidhur me njëri-tjetrin. Por ka një grup kaq të vogël shokësh që janë miq ekskluzivisht me njëri-tjetrin. Ja ku janë ata, të vegjëlit e gjelbër, ja ku janë miqtë dhe grupet e tyre të përbashkëta. Ata madje ranë veçmas këtu:

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Dhe për një rast fati, ishin pikërisht këta njerëz që shkruan nën këtë postim: "Navalny nuk ka prova" e kështu me radhë, shkruan të njëjtat komente. Sigurisht, nuk guxoj të nxjerr përfundime. Por megjithatë, kisha një postim tjetër në Facebook, kur pati një debat midis Lebedev dhe Navalny, i analizova komentet në të njëjtën mënyrë: doli që të gjithë njerëzit që shkruan "Lebedev është mut", ata nuk kishin qenë në rrjetet sociale. rrjetet kohët e fundit katër muaj, të pa abonuar në asnjë nga faqet publike, papritmas shkuan në këtë postim të veçantë, shkruanin pikërisht këtë koment dhe u larguan. Përsëri, është e pamundur të nxirren përfundime nga këtu, por dikush nga ekipi i Navalny më shkroi një koment se ata nuk përdorin robotë. Epo, në rregull!

Më afër reklamës, më afër markës. Të gjithë kanë robotë tani! Ne i kemi ato, konkurrentët tanë i kanë dhe të tjerët i kanë. Ata duhet të hidhen jashtë ose të lihen të jetojnë mirë; Bazuar në të dhëna të tilla (tregon rrëshqitjen e mëparshme), sillni ato në përsosmëri në mënyrë që të duken si njerëz të vërtetë dhe vetëm atëherë t'i përdorni ato. Edhe pse përdorimi i robotëve është i keq! Megjithatë, një histori mjaft e zakonshme...

Në modalitetin automatik, një gjë e tillë ju lejon të filtroni nga analiza juaj njerëz që nuk kanë lidhje me analizën, njerëz që nuk duhet të përfshihen në kampion, nuk duhet të përfshihen në këtë studim. Përdoret shumë shpesh. Pastaj përsëri, jo të gjithë pronarët e makinave kanë në të vërtetë makina. Ndonjëherë njerëzit janë të interesuar vetëm për njerëzit që potencialisht kanë një makinë, që ulen në disa grupe, komunikojnë me dikë, ata kanë një audiencë të caktuar atje.

Analiza e fakteve dhe opinioneve

Tjetri që kam është gjithashtu i preferuari im. Kjo është një analizë e fakteve dhe opinioneve.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Në ditët e sotme të gjithë dinë të përmendin markën e tyre në burime të ndryshme. Nuk ka asnjë sekret për këtë. Dhe të gjithë duket se janë në gjendje të llogarisin tonalitetin... Edhe pse personalisht, mendoj se metrika e tonalitetit në vetvete nuk është shumë interesante, sepse kur vjen dhe i thua klientit: "O njeri, ti ke 37% neutral", dhe ai thotë kështu. , " Uau! E ftohtë!" Prandaj, do të ishte më interesante të lëviznim pak më tej: nga vlerësimi i ndjenjave te vlerësimi i opinioneve të asaj që ata thonë për produktin tuaj.

Dhe kjo është gjithashtu një gjë shumë interesante, sepse... Unë personalisht besoj se në parim nuk mund të ketë mesazhe neutrale, sepse nëse një person shkruan diçka në hapësirën publike, ky mesazh është disi i ngjyrosur në çfarëdo mënyre. Unë personalisht nuk kam parë kurrë një mesazh neutral që përmend një markë. Zakonisht është një lloj papastërtie.

Nëse marrim një numër të madh të këtyre mesazheve (mund të jenë miliona, 10 milionë), nxjerrim në pah idenë kryesore nga secili mesazh, i kombinojmë ato, ne mund të kuptojmë me mjaft besueshmëri se çfarë thonë njerëzit për këtë markë, çfarë mendojnë ata. "Nuk më pëlqen paketimi", "Nuk më pëlqen konsistenca" dhe kështu me radhë.

Çfarë mendojnë njerëzit për Transaero, Chupa Chups dhe Presidentin e Shteteve të Bashkuara?

Unë kam një shembull qesharak: ky është një infografik se çfarë do të bënin përdoruesit e rrjeteve sociale me kompaninë Transaero pas falimentimit të saj.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Ka shumë shembuj interesantë atje: djeg, vrit, deporton në Evropë, madje 2% kanë shkruar - "Dërgoji në Siri për operacione ushtarake". Duke kaluar nga gjëja qesharake, mund të jetë pothuajse çdo markë - nga ushqimi im i preferuar për qentë e deri te disa makina. Kushdo që nuk i pëlqen paketimi, kujt nuk i pëlqejnë gjërat reale - gjithmonë mund të punoni me këtë, gjithmonë mund ta merrni parasysh këtë. Ka një numër të madh shembujsh kur njerëzit pothuajse ndryshuan prodhimin e produkteve të tyre sepse shkruanin në rrjetet sociale se Chupa Chups nuk ishte mjaft e rrumbullakët ose nuk ishte mjaft e ëmbël.

Ka një shembull tjetër qesharak. Merreni me mend çfarë komentesh dhe për kë?

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Për disa arsye, tani analiza e opinioneve, analiza e fakteve të nxjerra nga mesazhet, nuk është shumë e përdorur dhe nuk është shumë e përhapur. Megjithëse kjo teknologji nuk është super sekrete, praktikisht nuk ka fare njohuri për këtë, sepse nga komentet e njerëzve, nxjerrja e temës, kallëzuesi dhe grupimi i tyre nuk kërkon një gjeni në gjuhësinë llogaritëse. Nuk është aq e vështirë për të bërë. Por shpresoj që në dy vitet e ardhshme njerëzit do të fillojnë ta përdorin këtë, sepse... Do të jetë mirë - ky është një reagim kaq automatik! Ju gjithmonë e dini se çfarë thonë ata për ju. Epo, ju e kuptoni që kjo është bërë për Presidentin e SHBA.

Përgjigjja e një pyetjeje nga auditori:

  • Po, ky është Facebook në anglisht. Ato janë përkthyer në Rusisht këtu. Kjo ishte shkruar diku.

Big Data dhe teknologjitë politike

Në fakt, kam shumë shembuj të ndryshëm interesantë të politikës për Trump dhe gjithë të tjerët, por vendosëm të mos i sjellim këtu. Por ka një shembull politik.

Këto janë zgjedhje për Dumën e Shtetit. Kur keni qenë? Vitin e kaluar? Pothuajse një vit e gjysmë më parë.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Këtu janë personat të cilët kanë mundur të përcaktojnë vendndodhjen e tyre të saktë, deri në një gjeopikë të caktuar, për të kuptuar se në cilën zonë zgjedhore bien. Dhe më pas nga këta njerëz u morën vetëm ata që shprehën mendimin e tyre të prerë, për të cilët do të votonin.

Nga pikëpamja e teknologjisë politike, kjo nuk është shumë e saktë, sepse e gjithë kjo duhet të normalizohet nga dendësia e popullsisë etj. Gjithsesi, blutë këtu do të votojnë ju e dini kë, të kuqtë do të votojnë për shokët e opozitës, nga të cilët, meqë ra fjala, nuk ishin shumë.

Unë personalisht besoj se Big Data nuk do të arrijë shumë shpejt tek teknologjitë politike, por, si opsion, kandidati është edhe një markë. Dhe kjo është gjithashtu, deri diku, një analizë e fakteve dhe opinioneve për markën tuaj, dhe një gjë mjaft interesante, sepse ju mund të kuptoni në kohë reale se kush po bën çfarë. Unë di disa raste nga BBC, kur ata monitoruan rrjetet sociale në kohë reale në disa transmetime: kishte një përgjigje të tillë dhe të tillë, njerëzit shkruajnë për të, bëjnë pyetjen e tillë - dhe është e mrekullueshme! Unë mendoj se do të përdoret shumë shpejt, sepse është interesante për të gjithë.

Modelimi i pozicioneve të markës

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Tjetra kam modelimin e pozicioneve të markës. Një pjesë e vogël, e shkurtër se si mund të renditni markat duke përdorur metrika të ndryshme (jo pëlqimet e abonentëve në rrjetet sociale, por duke përdorur metrika komplekse, interesin për përmbajtjen, kohën e kaluar për marrjen e metrikave).

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Unë kam një shembull të "farmasë" për një arsye të caktuar. Këtu rrathët e vegjël janë të brendshëm, të shndritshëm - kjo është sasia e përmbajtjes së tekstit që krijon vetë marka, rrethi i madh është sasia e përmbajtjes së fotografive dhe videove që krijon vetë marka.

Afërsia me qendrën tregon se sa interesante është përmbajtja për audiencën. Ka një model të madh, ka një sërë parametrash të ndryshëm: pëlqime, ripostime, kohë përgjigjeje, kush ka ndarë mesatarisht atje... Këtu mund të shihni: ekziston një "Kagotsel" i mrekullueshëm, i cili pompon një sasi të madhe para për të krijuar përmbajtjen e vet, dhe për shkak të kësaj ata janë mjaft afër qendrës. Dhe ka shokë që krijojnë edhe përmbajtjen e tyre, por publikut nuk i intereson. Ky nuk është një shembull shumë adekuat, sepse të gjitha këto llogari janë praktikisht të vdekura.

Yegor Creed është i dashur më shumë se Basta

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Fatkeqësisht, pjesa tjetër... nga çfarë të tregojmë... Epo, ka edhe reperë rusë, si opsion, nga kompani të vërteta.

Cili është plusi? Fakti është se një kompani mund të vendosë pothuajse çdo gjë në një model të tillë, duke filluar nga paga mesatare e abonentëve që punojnë për markën tuaj; çdo model që ata duan. Për shkak se çdo agjenci reklamash llogarit metrikat e veta në mënyra të ndryshme, markat i llogarisin metrikat e tyre ndryshe.

Ekziston edhe një këtu - Basta, i cili gjeneron një sasi të madhe përmbajtjesh, por ndodhet në periferi, sepse kjo përmbajtje me sa duket nuk është shumë interesante për audiencën. Përsëri, nuk mendoj të gjykoj. Por megjithatë, ekziston Yegor Creed, i cili, sipas rrjeteve sociale, është pothuajse interpretuesi më i mirë i kohës sonë, por publikon vetëm fotografitë e tij personale. Sidoqoftë, ai ka një numër të madh pajtimtarësh: ka diku rreth një milion prej tyre. Nuk e mbaj mend numrin e saktë; Mbaj mend që përqindja e angazhimit të këtyre njerëzve është shumë më e lartë se 85%, domethënë, për milion abonentë ai merr 850 mijë përgjigje nga këta njerëz të vërtetë - kjo është një çmenduri e vërtetë. Kjo eshte e vertetë.

Arthur Khachuyan: "Të dhëna të mëdha reale në reklama"

Përgjigjet e pyetjeve nga audienca:

Sa kohë u desh për të krijuar modelin e analizës së reperit?

  • Secili ka audiencën e tij të synuar, interesat e këtyre njerëzve llogariten për secilin... E gjithë kjo normalizohet afërsisht në distancën nga qendra, pozicioni i tyre radial nuk është i rëndësishëm (thjesht lyhet këtu për bukuri, në mënyrë që ata të bëjnë të mos përplasen me njëri-tjetrin). Vetëm afërsia e përafërt me qendrën është e rëndësishme. Ky është modeli që ne përdorim. Për shembull, rrethi më pëlqen më shumë, disa njerëz e bëjnë atë në mendje si një gjysmërreth.
  • Ky model u përpilua shpejt, në dy ose tre orë (po, një person). Këtu janë futur vetëm metrikë: atë që e shumëzojmë me çfarë, e mbledhim dhe më pas e normalizojmë disi. Varet nga modeli. Ka njerëz që janë të interesuar për pagën mesatare (kjo nuk është shaka) e abonentëve të tyre. Dhe për këtë ju duhet të gjeni kontaktet e tyre, Avito, të llogaritni të gjitha, t'i shumëzoni. Ndodh që kjo kërkon shumë kohë për t'u marrë parasysh, por konkretisht kjo (tregon rrëshqitjen e mëparshme) - parametrat këtu janë shumë të thjeshtë: abonentë, ripostime, etj. U deshën rreth dy deri në tre orë për të përfunduar. Prandaj, kjo gjë përditësohet më pas në kohë reale dhe mund ta përdorni.

Tani vjen pjesa argëtuese. Kam mbaruar me shembuj, sepse nuk është interesante të flasësh për një kohë të gjatë vetëm. Dhe shpresoj që tani do të bëni pyetje dhe ne në fakt do të kalojmë nga tema në temë, sepse unë kam shembuj të tillë se si mund të përdoren teknologjitë e kështu me radhë...

Përgjigjet e pyetjeve nga audienca:

  • Unë kisha një dhe të vetëm rast personal me një, si të thuash, "afër-kazino", kur aty vendosej një aparat fotografik, njiheshin fytyrat e kështu me radhë. Përqindja e njerëzve të njohur është padyshim mjaft e madhe - si tonat ashtu edhe konkurrentët tanë. Por në fakt është mjaft interesante. Unë e shoh këtë si një gjë interesante: ju mund të kuptoni se cilët janë këta njerëz dhe të parashikoni mjaft mirë pse erdhën pikërisht këtu, çfarë ka ndryshuar në jetën e tyre aq shumë saqë ata vendosën të vinin në kazino. Por sa i përket llojeve specifike të biznesit ... Nëse e vendosni një gjë të tillë në një farmaci, atëherë nuk ka kuptim - nuk mund të parashikoni pse një person erdhi në farmaci.

    Detyra globale këtu ishte të ndërtonim një model për të kuptuar se kur një person dëshiron potencialisht të interesohet për markën tuaj, në mënyrë që t'i jepni atij reklamë jo pasi ai të ketë blerë diçka (siç po ndodh tani), por t'i jepni atij reklamë ". në parashikim” se kur do të ndodhë e gjithë kjo. Ishte interesante me një "afër-kazino" të tillë; doli të ishte një përqindje mjaft interesante e këtyre njerëzve - pse: dikush papritmas mori një promovim, dikush tjetër mori diçka tjetër - njohuri kaq interesante. Por me disa dyqane, me pakicë, me një dyqan pilulash, më duket se nuk do të jetë shumë korrekte.

A përdoren Big Data offline?

  • Ishte jashtë linje. Thjesht duhet të kuptoni saktësisht, afërsisht, nëse ky model do të përshtatet apo jo. Sërish me ujin e gazuar... në fakt më intereson gjithçka, por personalisht nuk e kuptoj se sa, si mund të varen profilet e këtyre njerëzve, sjellja e tyre kur duan të blejnë ujë në shishe. Edhe pse kjo mund të jetë vërtet e vërtetë, nuk e di.

Sa llogari të hapura në media sociale ka?

  • Ne në mënyrë specifike kemi 11 rrjete sociale - këto janë "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagram" dhe disa gjëra të vogla (mund të shikoj listën, si "Mail.ru" dhe kështu me radhë) . Në VKontakte ne patjetër kemi një kopje të të gjithë këtyre shokëve. Ne kemi njerëz në VKontakte - kjo është 430 milionë nga të gjithë ata që kanë ekzistuar ndonjëherë (nga të cilët rreth 200 milionë janë vazhdimisht aktivë); ka grupe, ka lidhje mes ketyre njerezve dhe ka permbajtje qe na intereson (teksti), dhe nje pjese e medias, por shume e vogel... E thene perafërsisht këtë foto: nëse ka fytyra aty, ne ruajini, nëse ka një meme, ne i ruajmë Nuk e ruajmë, sepse as ne nuk do të kishim mjaftueshëm për të ruajtur përmbajtjen mediatike.

    Ekziston një Facebook në gjuhën ruse. Diku tani 60-80% janë Odnoklassniki, pas nja dy muajsh ndoshta do t'i çojmë të gjitha deri në fund. Instagram rus. Për të gjitha këto rrjete sociale ka grupe, njerëz, lidhje mes tyre dhe tekst.

  • Rreth 400 milionë njerëz. Ekziston një hollësi: ka njerëz, qyteti i të cilëve nuk është specifikuar (ata janë potencialisht rusë / jo rusë); Nga këto, mesatarja për rrjetet sociale është 14% e llogarive të mbyllura në VKontakte, nuk e di shifrën e saktë në Facebook.
  • Ne gjithashtu nuk ruajmë media në Instagram - vetëm nëse ka fytyra atje. Ne nuk ruajmë përmbajtje të tilla (të tjera) mediatike. Zakonisht interesante: vetëm teksti, lidhjet mes njerëzve; Të gjitha. Hulumtimi më i zakonshëm në Instagram është kërkimi i zakonshëm për audiencën: kush janë këta njerëz dhe, më e rëndësishmja, lidhja e këtyre njerëzve me rrjetet e tjera sociale. Gjeni profilin e këtij personi në Vkontakte dhe Facebook për të llogaritur moshën e tij dhe kështu me radhë.
  • Nuk ka nevojë të përballeni ende me të gjithë të tjerët - thjesht sepse nuk ka klientë. Sa i përket gjuhës: kemi rusisht, anglisht, spanjisht, por megjithatë kjo përdoret ekskluzivisht për markat nga Rusia; mirë, ose kompanitë që i sjellin nga Rusia.
  • Ne intervistojmë njerëz çdo ditë në shumë, shumë, shumë tema: ne mbledhim të dhëna duke mbledhur ueb-in dhe i përditësojmë këta tregues duke përdorur Api. Në 2-3 ditë mund të kaloni nëpër të gjithë "VKontakte", duke kaluar nëpër to; Për rreth një javë mund të kaloni në tërësinë e Facebook, duke kuptuar se kush ka përditësuar çfarë dhe çfarë jo. Dhe pastaj mblidhni këta njerëz veç e veç: çfarë ka ndryshuar saktësisht, shkruani të gjithë këtë histori. Shumë rrallë në përvojën time profili i vjetër i mediave sociale të dikujt është përdorur për ndonjë qëllim të vërtetë biznesi. Kjo ishte koha kur një personazh politik aplikonte dhe detyra e tij ishte të kuptonte se çfarë lloj njerëzish vijnë në seli, kush ishin këta para 6-8 muajsh (a kanë fshirë profilin, por në fakt për një kandidat tjetër kanë ardhur fletët e votimit. prishin).

    Dhe disa herë - histori personale kur fotografitë e dikujt u publikuan në domenin publik. U desh të gjejmë lidhje etj. Fatkeqësisht, është për të ardhur keq, por ne nuk mund të dëshmojmë në gjykatë, sepse databaza jonë është ligjërisht jolikuide.

  • Ruajtja e MongoDB është e preferuara ime.

Rrjetet sociale po përpiqen të luftojnë mbledhjen e të dhënave

  • Zakonisht ne ngarkojmë vetëm një listë të këtyre llogarive te reklamuesit, dhe më pas ata përdorin atë standardin... Dmth, në rrjetet sociale, në VKontakte, mund të specifikoni një listë të këtyre njerëzve.

    Por Facebook përdor cookies të blera. Ne vetë nuk punojmë me cookie, por kishte disa histori kur vetë reklamuesi u dha disa njerëzve, ne ndërvepruam me ta - ata kanë këto rrjete, me reklama ngacmuese, jo ngacmuese, këto "cookie". Mund ta lidhni - nuk ka dyshim! Por nuk më pëlqejnë vërtet këto gjëra sepse nuk mendoj se janë shumë autentike. Kjo është thjesht për mendimin tim, është si TNS, i cili "gjurmon" televizorët - nuk është e qartë nëse po e shikoni këtë televizor apo jo, nëse po lani enët ndërsa televizori juaj është ndezur... Dhe është e njëjta gjë këtu. : Shumë shpesh kërkoj në google diçka në internet, por kjo nuk do të thotë se dua ta blej.

  • Nëse jeni duke përdorur një lloj rrjeti standard të reklamave kontekstuale: Kam pasur disa histori kur i shkarkojmë këta njerëz dhe u përpoqëm, duke përdorur ndërfaqet e tyre, t'i lidhnim me "cookies" në sajtet e tyre. Por nuk më pëlqejnë shumë gjëra të tilla.

Formula për llogaritjen e pagës së një përdoruesi të internetit

  • Formula e përgjithshme për pagën mesatare: ky është rajoni ku jeton një person, kjo është kategoria e biznesit në të cilën ai punon (d.m.th. kompania që është punëdhënësi i tij), pastaj merret pozicioni i tij në këtë kompani, mesatarja rroga për këtë pozicion është vlerësuar... Paga mesatare e marrë nga “Head Hunter” dhe “Superjob” (dhe ka disa burime të tjera) për një vend të lirë pune në një rajon të caktuar dhe për një kontekst të caktuar biznesi.

    Nga "Avito" dhe "Avto.ru" zakonisht merren parametra shtesë nëse një person ka ndriçuar telefonin. Me Avito mund të shihni se çfarë lloj gjërash po shet një person - të shtrenjta, të lira, të përdorura, jo të përdorura. Me "Avto.ru" mund të shihni nëse ai ka një makinë - ai e zotëron atë, ai nuk e zotëron atë. Kjo është diku më pak se 20% e njerëzve që kanë rënë aksidentalisht telefonin e tyre diku dhe llogaria e tyre mund të lidhet me këto të dhëna.

Çfarë vëllimesh operon kompania e mbledhjes së të dhënave?

  • Vëllimi i fotografive të ruajtura në petabajt është 6,4. Nuk mund të them saktësisht shkallën e rritjes tani, sepse në vitin 2016 filluam regjistrimin e "periskopëve" dhe sapo filluam regjistrimin e videove.

    Nuk mund të them saktësisht se kur ishte zero. Ne kaluam nga kompania në kompani - këto janë të gjitha histori të gjata. Por mund të them se VK, Facebook, Instagram dhe Twitter - i gjithë ky biznes (njerëz, grupe dhe lidhje mes tyre) me tekst dhe përmbajtje - në fakt nuk janë shumë të dhëna, nuk ka gjasa që edhe një petabyte të ketë mjaftueshëm. Unë mendoj se është 700 gigabajt, ndoshta 800.

A i ndihmoni klientët të përcaktojnë vendndodhjen aktuale dhe ku të gërmojnë?

  • Kur vjen një klient, ne i sugjerojmë gjëra të tilla, por ne vetë, si Google Trends, nuk bëjmë gjëra të tilla.
  • Kemi pasur disa histori gati sociologjike, me histori elektorale, parazgjedhore – i kemi analizuar të gjitha. Me markat dhe vlerësimin e opinioneve rreth markave, gjithçka pothuajse gjithmonë pajtohet. Këtu janë historitë zgjedhore-zgjedhore - jo (me një vlerësim se cili kandidat duhet të fitojë). Nuk e di kush gabon këtu – ne apo ata që mendojnë në VTsIOM.
  • Zakonisht këto rezultate kontrolli i marrim nga vetë marka, ata i marrin nga shokët që porosisin kërkime - kërkime telefonike, kërkime marketingu, e kështu me radhë. Plus, e gjithë kjo gjë mund të kontrollohet me gjëra themelore: dikush iu përgjigj listës së postimeve, dikush bëri sondazhe... Nëse është një markë e madhe (Coca-Cola, për shembull), ata patjetër kanë një milion ose dy komente të brendshme nga klientët – këto nuk janë vetëm komente në rrjetet sociale dhe disa opinione; Këto janë një lloj sistemesh të brendshme, rishikime, etj.

Ligji nuk “e di” se çfarë janë të dhënat personale!

  • Ne analizojmë ekskluzivisht burime të hapura të të dhënave dhe nuk përfshihemi kurrë në ndonjë mashtrim të ndyrë. Modeli ynë është ndërtuar mbi faktin se ne i ruajmë të gjitha të dhënat e hapura në disa qendra të dhënash publike, i marrim me qira diku tjetër dhe i analizojmë në shtëpi, në zyrat tona, në serverët tanë dhe nuk shkojnë askund jashtë territorit.

    Por legjislacioni ynë në fushën e të dhënave të hapura është shumë i paqartë.

    Ne nuk kemi një kuptim të qartë se çfarë janë të dhënat e hapura, cilat janë të dhënat personale - ekziston ky Ligji Federal i 152-të, por prapëseprapë... Si llogariten ato? Tani, nëse kam emrin tuaj dhe numrin tuaj të telefonit në një bazë të dhënash, në një tjetër bazë të dhënash kam numrin tuaj të telefonit dhe e-mailin tuaj, në një të tretë kam, le të themi, emailin tuaj dhe makinën tuaj; Të gjitha këto duket se janë të dhëna jo personale. Nëse i bashkoni të gjitha këto, duket se sipas ligjit do të bëhen të dhëna personale.

    Ne e rrethojmë këtë në dy mënyra. E para është instalimi i një serveri me softuer për klientin, dhe më pas këto të dhëna nuk shkojnë përtej territorit të tij, dhe më pas klienti është përgjegjës për shpërndarjen e këtyre të dhënave personale, të dhëna jopersonale etj. Ose opsioni i dytë: nëse kjo është një lloj historie ku duhet të padisni një rrjet social ose diçka tjetër...

    Ne kishim një studim të tillë kur mblodhëm (kishte primare të Rusisë së Bashkuar) për Lifenews llogaritë e këtyre shokëve dhe shikonim se çfarë lloj pornografie pëlqenin. Ishte një gjë qesharake, por gjithsesi. Ne e shesim këtë si mendimin tonë, personal, pa zbuluar ligjërisht në dokumente atë që kemi analizuar - Regjistrin e Unifikuar Shtetëror të Personave Juridik, pagat, rrjetet sociale; Ne shesim mendimin e ekspertit, dhe më pas i shpjegojmë personit se çfarë kemi analizuar dhe si.
    Kishte disa histori, por ato lidheshin me disa projekte publike tregtare. Për shembull, ne kemi një projekt jofitimprurës falas për ata që ngasin dërrasa të gjata (borde të tilla janë të gjata): detyra ishte të mblidhnim botimet e njerëzve - kur dikush poston "Shkova në Gorky Park për një udhëtim". Dhe tani ai duhet të futet në hartë, dhe njerëzit përreth tij mund të shohin se dikush është afër tij. VK-ja na nguli kokat për këtë temë për një kohë shumë të gjatë, sepse atyre nuk u pëlqeu fakti që ne po publikonim këtë informacion pa lejen e njerëzve. Por më pas çështja nuk erdhi në gjykatë, sepse brenda disa komuniteteve të mëdha i shtuam rregullave që të dhënat të mund të përdoreshin nga palë të treta, agjenci, kompani, analiza etj. Sigurisht, nuk ishte veçanërisht etike, por gjithsesi.

  • Sapo e kuptuam me kohë dhe filluam t'ua shesim mendimin tonë të ekspertëve të gjithëve.

A punoni me institucionet arsimore?

  • Ne bashkëpunojmë me institucionet arsimore, po. Ne kemi një gamë të tërë: kemi një program master në Shkollën e Lartë dhe bashkëpunojmë me universitete të tjera. Ne i duam shumë universitetet!
  • Nëse keni kontaktet e mia, mund të më shkruani. Dhe një lidhje me prezantimin, nëse dikush është i interesuar - të gjithë këta shembuj janë atje, mund ta zhvendosni.
  • Nëse e dini numrin e telefonit, postën - ky është një opsion pothuajse njëqind për qind, askush nuk do ta heqë atë. Nëse nuk ka numër telefoni, zakonisht është një foto; nëse nuk ka foto, është viti, vendbanimi, puna. Kjo do të thotë, sipas vitit, vendbanimit dhe punës, pothuajse të gjithë mund të identifikohen gjithmonë mjaft delikate. Por kjo, përsëri, është një pyetje në lidhje me detyrën.

    Ne kemi, le të themi, një klient që shet televizion në internet. Dikush bleu një abonim në këto "Games of Thrones" prej tyre, dhe detyra është që të përdorin CRM-në e tyre për të gjetur këta njerëz në rrjetet sociale dhe më pas të gjejnë ata të mundshëm nga zona e tyre e ndikimit. Thjesht dua të them se ata kanë, le të themi, një emër, mbiemër dhe e-mail... Dhe pastaj është shumë e vështirë të bësh diçka. Në shumicën e rasteve, njerëzit mund të gjenden me e-mail.

  • Në bazë të përbërjes së miqve tanë, ne zakonisht “përputhim” njerëzit në rrjetet sociale, por kjo nuk është gjithmonë e saktë. Nuk është se nuk është gjithmonë e drejtë - jo gjithmonë funksionon. Së pari, kjo kërkon shumë mund, sepse ky operacion (përputhja e njerëzve) do të duhet të kryhet së pari për secilin nga miqtë - për të kuptuar nëse ata kanë ardhur nga rrjetet sociale apo jo. Dhe pastaj - një fakt i panjohur për këdo që në VKontakte kemi të njëjtët miq, në Facebook kemi miq të ndryshëm. Jo për të gjithë, por për mua, për shembull, është kështu; dhe kjo është e vërtetë edhe për shumicën e njerëzve.

Si mblidhen të dhënat më të plota?

  • Instalimi i softuerit për klientin në anën e tij. Në to është instaluar një server, i cili merr vetëm të dhëna publike nga ne dhe përpunon të dhënat e tyre personale brenda. Një NDA është lidhur me klientin. Kjo, natyrisht, nuk është shumë e saktë që ata ta transferojnë këtë tek ne, por përgjegjësia ligjore i takon klientit - mirë, domethënë instalimi i softuerit për të, ose transferimi i të dhënave anonime. Por kjo ishte shumë e rrallë, sepse - anonimizim i saktë ose i pasaktë - në shumicën e rasteve varësia midis këtyre njerëzve humbet.

Kush blen softuer për njohjen e fytyrës?

  • Ne në fakt po shkojmë këtu sepse softueri ynë kryesor që ne shesim është kërkimi i fytyrës, analiza e korrelacionit dhe ua shesim atë agjencive qeveritare. Dhe një vit e gjysmë më parë, ne vendosëm që të gjitha këto histori t'i vendosnim në reklama, në marketing, në tregun publik - kështu u formua Social Data Hub, një ent juridik tregtar. Dhe tani sapo vijmë këtu. Ne jemi këtu për një vit e gjysmë tani, duke u përpjekur t'u shpjegojmë njerëzve se nuk ka nevojë t'u jepet njerëzve shkarkime me një përmendje, se atyre u duhet dhënë përgjigje për pyetjet, se nuk ka nevojë për tonalitet. , dhe kështu me radhë. Kështu që është e vështirë të thuhet se ku...
  • (Kë do të thotë?) Për të gjithë shokët që duhet të kërkojnë terroristë dhe pedofilë.
    Mund të them menjëherë (kjo do të jetë pyetja tjetër): sipas të dhënave tona, asnjë mësues nuk u burgos për ripostim.
  • Në VKontakte - 14%; në Facebook nuk ka asnjë profil të mbyllur si i tillë (ekziston një listë e mbyllur miqsh, e kështu me radhë). Dhe gjëja më interesante është se sapo shkrova një mesazh - tani ata do të numërojnë dhe thonë.

Mos postoni diçka për të cilën do të keni turp!

  • Mos postoni asgjë në rrjetet sociale që do t'ju turpëronte - unë personalisht e ndjek këtë. Edhe pse kam pasur shumë personale, sepse shaj në Facebook. Epo, kishte dhe kishte diçka për të bërë... Mos postoni asgjë që do të ishte e turpshme! Nëse më vonë do të punoni diku në Dhomën Publike, po, është më mirë të mos komentoni. Nëse nuk do ta bëni këtë, në përgjithësi, askush nuk kujdeset. Mund t'ju siguroj vetëm se askush nuk e lexon korrespondencën tuaj personale dhe e gjithë kjo po ndërton gjithë këtë histori...

    Çdo javë, dikush vjen patjetër tek unë dhe më thotë: “Epo, fotot e mikut tim kanë rrjedhur në një faqe publike anonime! Ndihmë! Meqë ra fjala, mos publikoni kurrë asgjë në faqet publike anonime.

  • Nuk di per sisteme te tjera monitorimi - do ta marrim patjeter kete parasysh, qe permendja e markes ishte negative, Zoti me falte... Por mund te them qe gjithfare shokeve te afert shteteror interesohen vetem per njerez. të cilët kanë një audiencë prej më shumë se 5 mijë, dhe opinioni i tyre publik mund të ndikojë tek dikush, pastaj të ndikojë. Në përvojën time, nuk ka ndodhur kurrë që agjencia e burimeve njerëzore që urdhëron vlerësimet e profilit nga ne të thotë: "Kush i pëlqen Navalny, mos punësoni askënd!"

Rreth publikimit të rezultateve. Sa njerëz janë të punësuar në kërkime?

  • Nga 10 kompanitë kryesore të reklamave, shtatë po publikojnë tani. Është e vështirë të thuash: kur e filluam këtë një vit e gjysmë më parë... Ne kemi disa njerëz në secilën zonë - ka disa njerëz në banka, ka disa njerëz në HR, ka disa njerëz në reklama. Dhe tani po mendojmë se kush është më fitimprurës të shkojmë së pari, për të cilët duhet të fillojmë të bëjmë disa ndërfaqe...
  • (për numrin e njerëzve për segment të tregut) Jo më shumë se 25 persona, sepse nuk kemi përdhunuar njeri.
  • Në përgjithësi, në parim, këto teknologji nga tregu përdoren, mendoj, me më shumë se 50%. Disa në fushata reklamuese, disa në një lloj analize të brendshme. Unë do të thosha se 40 përqind e përdorin atë në analitikë të brendshme, 50-60% e shesin atë në markat fundore. Por kjo tashmë varet nga vetë kompanitë e reklamave. E shihni, disa njerëz raportojnë thjesht për paratë e shpenzuara, reklamat që vendosin, ndërsa të tjerët shkruajnë se sa njerëz sollën, çfarë lloj audiencash... Unë do të thosha kështu, por mund të gaboj - nuk e bëj vërtetë mos imagjinoni se si funksionojnë të gjithë këta shokë. Unë e di vetëm në të dhëna sasiore.

Disa reklama 🙂

Faleminderit që qëndruat me ne. A ju pëlqejnë artikujt tanë? Dëshironi të shihni përmbajtje më interesante? Na mbështesni duke bërë një porosi ose duke rekomanduar miqve, cloud VPS për zhvilluesit nga 4.99 dollarë, një analog unik i serverëve të nivelit të hyrjes, i cili u shpik nga ne për ju: E gjithë e vërteta rreth VPS (KVM) E5-2697 v3 (6 bërthama) 10 GB DDR4 480 GB SSD 1 Gbps nga 19 dollarë ose si të ndani një server? (e disponueshme me RAID1 dhe RAID10, deri në 24 bërthama dhe deri në 40 GB DDR4).

Dell R730xd 2 herë më lirë në qendrën e të dhënave Equinix Tier IV në Amsterdam? Vetëm këtu 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV nga 199$ në Holandë! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - nga 99 dollarë! Lexoni rreth Si të ndërtohet korporata e infrastrukturës. klasë me përdorimin e serverëve Dell R730xd E5-2650 v4 me vlerë 9000 euro për një qindarkë?

Burimi: www.habr.com

Shto një koment