Arthur Khachuyan: „Valódi nagy adat a reklámban”

14. március 2017-én Arthur Khachuyan, a Social Data Hub vezérigazgatója beszélt a BBDO előadásán. Arthur beszélt az intelligens megfigyelésről, a viselkedési modellek felépítéséről, a fotó- és videótartalmak felismeréséről, valamint más Social Data Hub eszközökről és kutatásokról, amelyek lehetővé teszik a közönség megcélzását a közösségi hálózatok és a Big Data technológiák segítségével.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Arthur Khachuyan (a továbbiakban – AH): - Helló! Sziasztok! A nevem Arthur Khachuyan, a Social Data Hub céget vezetem, és különféle érdekes intellektuális elemzésekkel foglalkozunk nyílt adatforrásokról, információs mezőkről, és mindenféle érdekes kutatást végzünk, és így tovább.

Ma pedig a BBDO Csoport munkatársai arra kértek minket, hogy beszéljünk a big data, a big és a nem túl nagy adatok elemzésére szolgáló modern technológiákról: hogyan használják fel őket, mutassunk néhány érdekes példát. Remélem, hogy közben kérdéseket tesz fel, mert unatkozhatok, és nem árulom el a lényeget és így tovább, szóval ne szégyellje magát.

Tulajdonképpen a fő irányok, ahol valaha valamilyen „közel-big-data” megoldást használtak, ezek mind egyértelműek – ez a célközönség megcélzása, elemzése, valamilyen elemző marketingkutatás elvégzése. De mindig érdekes, hogy milyen további adatok, milyen további jelentések találhatók az elemzés alkalmazása után.

Miért van szükségünk technológiára a reklámozáshoz?

Hol kezdjük? A legnyilvánvalóbb dolog a közösségi hálózatokon való hirdetés. Ma reggel levettem: valamiért úgy gondolja a VKontakte, hogy látnom kellene ezt a bizonyos reklámot... Hogy ez jó vagy rossz, az a második kérdés. Úgy látjuk, határozottan a sorkatonák kategóriájába tartozom:

Arthur Khachuyan: „Valódi nagy adat a reklámban”

A legelső és legérdekesebb dolog, ami technológiai megoldásként fogható fel... Az első dolog, amit el akartam dönteni, mielőtt belekezdenénk, a fogalmak meghatározása: mi a nyílt adat és mi a big data? Mert minden embernek megvan a maga megértése ebben a kérdésben, és nem akarom senkire ráerőltetni a feltételeimet, de... Csak hogy ne legyenek eltérések.

Személy szerint úgy gondolom, hogy a nyílt adatok jelentik mindazt, amit minden bejelentkezés vagy jelszó nélkül elérhetek. Ez egy nyitott profil a közösségi oldalakon, ez keresési eredmények, ezek nyílt nyilvántartások stb. Big data, saját értelmezésem szerint, így látom: ha adattábla, akkor milliárd sor, ha valamiféle fájltárhely, ez valahol egy petabájtnyi adat. A többi az én terminológiámban nem big data, hanem valami ilyesmi.

Nagy pontosságú profilozás és profilpontozás

Menjünk sorban. A legelső és legérdekesebb dolog, amit a nyílt adatforrások elemzése során találhat, a nagy pontosságú profilalkotás és profilpontozás. Mi ez? Ez egy olyan történet, amelyben a közösségi hálózati fiókja nemcsak az Ön érdeklődési körét, hanem azt is megjósolja.

De most a különböző források kombinálásával megértheti, hogy átlagosan mekkora fizetése van, mennyibe kerül a lakása, és hol található. És mindezek az adatok szó szerint felhasználhatók a rendelkezésre álló eszközökből. Például, ha felveszi fiókját egy közösségi hálózaton, nézze meg, mondjuk, hol lakik, hol dolgozik; megérteni, hogy az üzlet mely részlegébe tartozik a cég, ahol dolgozik; töltsön le hasonló állásokat a HH-tól és a „Superjob”-tól, ha elemző, menedzser stb.; nézd meg, hol élsz (bázis, mondjuk CIAN), értsd meg, mennyibe kerül ezen a helyen lakást bérelni, mennyibe kerül ezen a helyen lakást venni, jósold meg hozzávetőlegesen mennyit keresel. Ezenkívül a közösségi hálózatok segítségével megértheti, hogy mennyit utazik, hol van, és mennyire lojális munkáltatójához.

Ennek megfelelően ilyen hatalmas számú mérőszámból bármit megtehetünk, amit akarunk. Bemutathatunk Önnek egy olyan terméket, amely érdekli. El tudsz képzelni egy webáruházat? Odamész - ez az online áruház elkapja fiókodat egy közösségi hálózaton, és azt mondja neked: „Mása, most szakítottál a barátoddal, itt van néhány termék az Ön számára.” Ez nem a közeljövő...

Hogyan határozható meg egy személy földrajzi elhelyezkedése?

Válaszok a hallgatóság kérdéseire:

  • Általában az összes bejelentkezés 80%-át tekintik a pontos lakóhelynek. De azoknak, akik nem jelentkeznek be sehova, több lehetőség is van: vagy bejelentkezés, vagy földrajzi helymeghatározás, vagy ez a bejegyzések és publikációk elemzése arra az időszakra vonatkozóan, amikor valaki írt valamit... És valahol, valami olyasmi jelenik meg, mint „Babakocsit szeretnék venni az Akademicskaja közelében” vagy „Nemrég láttam itt a falon csúnya graffitit”. Vagyis az emberek közel 80%-ának földrajzi elhelyezkedése, munkahelye és lakóhelye meghatározható a közösségi hálózatokról gyűjthető adatok vagy metaadatok segítségével.

    Ez ismét a bejegyzések elemzése. A legegyszerűbb értelemben ez a közösségi hálózatok bejelentkezéseinek és földrajzi helyeinek elemzése, amelyek nem törlik a jpeg metaadatokat (kitalálhat valamit). De a többiek számára ezek általában szöveges adások: vagy „kifényesíti” a tartózkodási helyét, amikor valamiről ír, vagy „megvilágítja” a telefonját, amelyen megtalálhatja az Avitóban vagy a fiókjában megjelent hirdetéseit. Auto RU". Ezen adatok alapján kombinálhatja (például „Egy autót árulok Majakovskaya közelében”), és nagyjából ezt feltételezheti.

  • Az emberek általában ezt teszik közzé a közösségi médiában. Csak nyílt forráskóddal dolgozunk, és itt kizárólag nyílt forrásokról beszélünk. Általában hirdetéseket adnak ki, vagyis az esetek hatvan százalékában a legáltalánosabb történet, amikor az emberek „felmutatják” aktuális mobiltelefonszámukat, valami eladási hirdetés. Vagy egyes csoportokban ír az ember ("ezt vagy azt eladom ott"), vagy elmegy valahova.

    Igen! Általában így kommentálják: „Válaszolj vagy küldj SMS-t, hívd fel a számomat. Ez nagyon gyakran megtörténik olyan emberekkel, akik eladnak valamit, vásárolnak valamit a közösségi oldalakon, kommunikálnak valakivel... Ennek megfelelően ezzel a számmal hozzá lehet kapcsolni a CIAN-on lévő profilját, ha már publikált valamit, vagy ismét Avito. Egyszerűen ezek a legnépszerűbb, legnépszerűbb források, ez a továbbiakban lesz – ezek az Avito, a CIAN és így tovább.

  • Ez egy online áruházra vonatkozik. Következő lesz az arcfelismerés és a profilillesztés technológiája (beszélni fogunk róla). Pusztán elméletileg ez egy offline boltra is alkalmazható. És általában is az a nagy álmom, hogy amikor megjelennek az utcai transzparensek, ha elsétálsz egy kamera mellett, az „csapdába ejti” az arcodat. De ezt az esetet törvény tiltja majd, mert sérti a magánéletet. Remélem előbb-utóbb megtörténik.
  • Személyes tapasztalatból. Nagyon gyakran, amikor valaki ír neked valamit, az életéből olyan tényeket operálsz, amelyeket úgy tűnik, nem szabad tudnod... Az emberek a legtöbb esetben megijednek. De! A legutóbbi statisztikák alapján a közösségi oldalakon 14%-kal csökkent a lezárt fiókok száma. Növekszik a hamisítványok száma, nő a nyitott számlák száma – az emberek egyre inkább a nyitottság felé haladnak. Szerintem 3-4 év múlva már nem reagálnak olyan hevesen arra, hogy valaki olyan információt tud róluk, amit esetleg nem kellene tudnia. De valójában nagyon könnyű elérni, ha ránézünk a falára.

Mit lehet átvenni nyílt forrásból?

Van egy hozzávetőleges lista azokról a dolgokról, amelyeket meglehetősen nagy megbízhatósággal lehet megérteni nyílt forrásokból. Valójában még több különböző mérőszám létezik; ez az ilyen kutatás megrendelőjétől függ. Van néhány HR-ügynökség, amelyet az érdekel, hogy a közösségi oldalakon káromkodsz-e, vagy valahol a nyilvános térben. Valakit érdekel, hogy szereti-e Navalnij kiadványait, vagy éppen ellenkezőleg, az Egyesült Oroszország kiadványait, vagy valamilyen pornográf tartalmat – ilyen dolgok elég gyakran előfordulnak.

A legfontosabbak a családi értékek, egy lakás, otthon hozzávetőleges költsége, autókeresés stb. Ez alapján az emberek társadalmi csoportokra oszthatók. Ők a Moszkvai Tinder felhasználók, kik is ők (a Facebook-fiókjukon található képeik szerint); Érdeklődésük alapján különböző társadalmi csoportokra oszthatók:

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Ha közelebb kerülünk a reklámozáshoz, akkor lassan eltávolodtunk a szokásos hirdetési célzástól, amikor a VKontakte-n azt választja, hogy bizonyos csoportokhoz feliratkozott 18 éves férfiak iránt érdeklődik. Legközelebb ez a képem van, most megmutatom:

Arthur Khachuyan: „Valódi nagy adat a reklámban”

A lényeg az, hogy a legtöbb jelenlegi szolgáltatás, amely elvileg a közösségi hálózatokat elemző embereket elemzi, érdeklődési körök elemzésével foglalkozik... Az első dolog, ami az emberek eszébe jut, az, hogy elemzik az előfizetőik felső csoportjait. Lehet, hogy ez egyesek számára működik, de személy szerint alapvetően rossznak gondolom. Miért?

A tetszésnyilvánításait összegyűjti és elemzi

Most pedig vedd elő a telefonjaidat, nézd meg a legjobb csoportjaidat – biztosan több mint 50%-a lesz azoknak a csoportoknak, amelyekről már megfeledkezett, ez egy olyan tartalom, amely valójában nem releváns az Ön számára. Egyáltalán nem fogyasztja, de a rendszer ezek szerint követi: feliratkozott-e receptekre, néhány népszerű csoportra. Vagyis megsérted a profilodat elemző rendszert, és érdekeid nem lesznek igazolva.

Tovább... Mi van? Feltételezzük, hogy mások mit csinálnak. Véleményünk szerint a felhasználók érdeklődésének felmérésére a legmegfelelőbb módszer a like-ok. Például a VKontakte-on nincs kedvelések hírcsatornája, és az emberek azt hiszik, hogy senki sem tudja, mit szeretnek. Igen, a lájkok egy részét bevezetik az Instagramon, látunk valamit a Facebookon is, de bizonyos csoportokban a tartalmak nagy része ezt nem közvetíti egy közös feedben, és az emberek élnek, és azt hiszik, hogy senki sem fogja tudni, mit szeret.

És ha összegyűjtünk bizonyos, minket érdeklő tartalmakat, összegyűjtjük ezeket a bejegyzéseket, összegyűjtjük ezeket a lájkokat, majd az adatbázis segítségével ellenőrizzük ezt a személyt, nagy pontossággal meg tudjuk határozni, ki ő, mi a sorsa, mi érdekli. Helyezze őt pontosan egy bizonyos társadalmi csoportba, és lépjen kapcsolatba vele.

Az autóvásárlás megváltoztatja a viselkedést

Van egy ilyen példám. Azonnal leszögezem, hogy a példáim reklám- és marketingközeli jellegűek, mert tudod, a legtöbb esetet az NDA védi és így tovább. De lesz még sok érdekesség. Tehát a történet ezekkel az emberekkel: ezek olyan férfiak, akik 2010 és 2015 között vettek autót. Azt, hogy online közösségi viselkedésük hogyan változott, szín jelzi. Változott a lányok aránya a feliratkozók között, „fiús” nyilvános oldalakra iratkoztam fel, állandó szexpartnert találtam...

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Ez az egész autómárka és személyszám szerint van lebontva. Innen sok érdekes következtetést vonhat le az emberek viselkedéséről és annak működéséről. Mondhatom, hogy a Porsche Cayenne és az ültetett Priora a vonzott közönség számát tekintve szinte egyforma. Ennek a közönségnek a minősége és viselkedése eltérő, de mennyisége megközelítőleg azonos. Ebből a következtetést levonhatja, amit csak akar, közelebb a piacához. Ha eladsz egy Audit, akkor azt a szlogent használod, hogy „Vegyél Audit, és tűnj el a szüleidtől!” stb.

Igen, ez egy vicces példa arra, hogy az emberek viselkedése a lájkok elemzése alapján, az alapján, hogy melyik csoportba költöznek, milyen tartalmat elemeznek - szinte 100%-os valószínűséggel egyértelművé teszi, hogy ki vagy. Mert ha nem fér hozzá a hálózati forgalomhoz, és nem olvas személyes üzeneteket, a like-ok mindig megmondják, ki ez a személy - terhes nő, anya, katona, rendőr. És neked, mint hirdetni tudó embernek ez nagy sikert arat.

Válaszok a hallgatóság kérdéseire:

  • Minden oszlop az autóban utazók számát mutatja; hogyan változtak viselkedésmintáik. Nézd: azok, akik Porsche Cayenne-t vásároltak - körülbelül 550 fő (sárga), nőtt a lányok aránya az előfizetők között.
  • A minta a „Vkontakte”, „Facebook”, „Instagram” közösségi hálózatok felhasználói 2010 és 2015 között. Az egyetlen pontosítás: az ide kiválasztott autók azok, amelyek bizonyos eszközökkel több mint 80%-os pontossággal azonosíthatók a fényképeken.
  • Egy bizonyos időn át az autója (na jó, nem az övé, ezt bízzuk a közösségi oldalakra)... Egy bizonyos időn keresztül folyamatosan fényképeztek egy embert az autóval, volt vele, a kiadványok különbözőek voltak, a fényképek különböző szögekből készültek, és így tovább . Utána lesz egy kép arról, hogy mely emberek milyen autókkal fotóznak, és... Igen, ez a második kérdés – a közösségi hálózatok adataiba vetett bizalom.
  • Mióta felhoztuk, sajnos a közösségi média adatai nem mindig helyesek. Az emberek nem mindig hajlandók közzétenni információikat. Személy szerint én végeztem egy ilyen tanulmányt: összehasonlítottam a moszkvai egyetemeken végzettek számát a közösségi hálózatokon regisztrált emberek számával. Átlagosan 60%-kal többen vannak regisztrálva a közösségi hálózatokon – a Moszkvai Állami Egyetemen egy bizonyos évben végzett bizonyos szakokon –, mint amennyi elvileg valójában van. Tehát igen – természetesen itt van a hibák százalékos aránya, és ezt senki sem titkolja. Itt egyszerűen azokat az autókat vesszük alapul, amelyek 80%-nál nagyobb valószínűséggel azonosíthatók.

A modellképzés forrásainak listája

Íme egy minta lista a felhasználható forrásokról, amelyek segítségével nagy biztonsággal meghatározható egy személy társadalmi profilja, ki is ő.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Profilt veszünk a közösségi hálózatokról, a CIAN-ról - egy lakás ára hozzávetőlegesen "Fejvadász", "Szuperjob" - ez egy adott személy átlagos fizetése. Remélem itt nincsenek Head Hunter képviselők, mert szerintük nem túl jó ezeket az adatokat átvenni tőlük. Ez azonban bizonyos régiókban az üres álláshelyek bizonyos típusú tevékenységeiért járó átlagfizetés.

„Avito”, „Avto.ru”: nagyon gyakran az emberek, amikor a telefon világít, biztosan van (sok esetben) legalább valami az „Avito”, vagy „Avto.ru” oldalon, ill. egy másik oldalon számos webhely, ahonnan megértheti, kik ők. Ha babakocsit vagy autót adtak el ezen a telefonszámon... A Rosstat és a Jogi Személyek Egységes Állami Nyilvántartása még mindig több olyan nyilvántartás, amelynek segítségével rangsorolhatja a foglalkoztató céget - valamilyen képlet szerint, olyan modell szerint, bárki beállíthatja (nagyjából meghatározhatja ennek a személynek a pénzét stb.).

A Tinder segít adatokat gyűjteni az emberek helyzetéről

Ráadásul van egy ilyen érdekes dolog (vagy nagyon vicces a tanulmányban) - ez ismét a Moszkva Tinder adatainak gyűjtése a Tinder robotjaival. Meghatározták az emberek távolságát, majd a hozzávetőleges elhelyezkedésüket.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Ennek a tanulmánynak az volt a célja, hogy meghatározza a Tinder-számlák számát a kormányzati intézmények területén - a Dumában, az ügyészségen stb. De te, mint hirdető, azt képzelhetsz el, amit csak akarsz: lehet például Starbucks vagy valaki más... Vagyis a Tinderen hány ember iszik tőled kávét, rendel valamit, van boltban. Ezzel a földrajzi helymeghatározással kapcsolatban: ezt bármilyen szolgáltatással meg lehet tenni.

Válasz a közönség kérdésére:

  • Tapló? Nem tudod? A Tinder egy társkereső alkalmazás, ahol átnézhet fényképeket (bal-jobb), és ez az alkalmazás megmutatja a távolságot az adott személytől. Ha három különböző pontról kapja meg a távolságot ehhez a személyhez, akkor hozzávetőlegesen (+ 5-7 méter) meg tudja határozni a helyet. Ebben az esetben az ügyészség vagy az Állami Duma területén történő megállapítás nem olyan nehéz. De még egyszer mondom, ez lehet az üzleted, bármi lehet.

Például nagyon-nagyon régen volt egy ilyen esetünk (nem tanulmány), amikor az egyik mobilszolgáltatótól kaptunk adatokat a forgalom sűrűségéről, a cellapontok mozgássűrűségéről, és mindezt egymásra raktuk. autópályákon elhelyezett hirdetőtáblák koordinátáin . A mobilszolgáltató feladata pedig az, hogy hozzávetőlegesen megállapítsa, hányan járnak el mellette, és esetleg láthatják ezt az óriásplakát-hirdetést.

Ha vannak itt óriásplakát-reklám-specialisták, akkor azt lehet mondani: szupermegbízhatósággal nem lehet megérteni - valaki jön, valaki nem nézett, valaki megnézte... Ennek ellenére ez egy példa arra, hogy van 20 milliárd sokszög ezek Moszkvában, ahol ezeknek az embereknek a sűrűsége minden órában bizonyos útvonalakon... Bármelyik pillanatban megnézheti, mi mellett haladtak el ezek az emberek, és hozzávetőlegesen megbecsülheti az utasforgalmat.

Válasz a közönség kérdésére:

  • Senki nem ad ilyen adatokat. Az egyik operátornál végeztünk egy ilyen vizsgálatot, ez egy kizárólag belső történet, így sajnos nem képek formájában mutatjuk be. De gyakran a nagy reklámügynökségeknek nem okoz problémát az üzemeltetővel való kapcsolatfelvétel. Legalábbis Moszkvában számos precedens van, amikor például a biztosítótársaságok olyan társaságokhoz fordulnak, mint a GetTaxi, amelyek személytelen adatokat szolgáltatnak a sofőr életkoráról, vezetési módjáról (jó - rossz, meggondolatlan - nem), hogy előre jelezzék. irányelvek és így tovább. Ezzel mindenki küszködik, de valamilyen belső szinten névtelen adatszolgáltatás - szerintem senkinek nincs ilyen gondja.

Kép- és mintafelismerés

Menj tovább. A kedvencem a képfelismerés. Lesz egy kis rész az emberek arc alapján történő kereséséről, de ezt a részt többnyire nem vállaljuk. Kifejezetten képfelismerést és annak meghatározását vesszük, hogy mi van ezen a képen - az autó márkája, színe stb.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Van egy vicces példám:

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Volt egy ilyen tanulmány a tetoválások kereséséről különböző közösségi hálózatokon. Ennek megfelelően ugyanez alkalmazható bármely márkára, bármilyen vizuális arculatra, szinte bármilyen vizuális arculatra. Van, amit nem lehet megbízhatóan meghatározni (nem vesszük).

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Íme a kedvencem. Az autómárkák gyakran azért fordulnak ehhez a feladathoz, mert feladatuk például az, hogy megtalálják néhány BMW X6-os összes tulajdonosát, megértsék, kik ők, hogyan kapcsolódnak egymáshoz, mi érdekli őket stb. Ez azzal a kérdéssel kapcsolatos, hogy milyen autókkal fotóznak az emberek a közösségi hálózatokon.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Itt egyáltalán nem volt szűrés: a tárgy az övék, az autó nem az övék; Ez csak az autók meghibásodása – az életkor és így tovább. De a vizuális képfelismerést elég gyakran használják: ez a terhes nők keresése, és a márkalogók keresése valamilyen tömegmédiában (ki mit posztol).

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Kedvenc esetem (amit különféle éttermek használnak): milyen tekercseket tesznek közzé egy közösségi hálózaton. Vicces dolog, de valójában sok érdekes dolgot megérthetsz vele, először is a saját ügyfeleidről: kik jöttek hozzád és miért tették. Mert az nem titok, hogy a sushi bárokban a legtöbb ember (nem azt mondom, hogy "lányok") azért fényképez, hogy bejelentkezzen, lefotózzon valamit stb.

A márka ezt kihasználhatja. A márkát az érdekli, hogy milyen termékekre van szüksége ahhoz, hogy szépen fotózzon, posztoljon, milyen emberek jöttek oda. Ezt a dolgot szinte bármivel meg lehet csinálni, ételtől kezdve.

Videó minta felismerés

Válasz a közönség kérdésére:

  • Videón nem. Nálunk teszt üzemmódban van. Kipróbáltuk ezt a technológiát, de kiderült, hogy... Videóval elég jól felismer mindent, de sehol nem találtunk rá alkalmazást. Viszlát. Azon kívül, hogy elemezzük, mennyit és melyik videóbloggerek beszélnek valahol... Volt egy ilyen tanulmány. Hány arcuk találkozik, milyen gyakran. De a márkák még nem találták ki, hol álljanak elő ezzel. Talán egyszer eljön.

Ez ismét élelmiszer, lehet terhes nők, férfiak (nem terhes), autók - bármi.

Lehetőség volt egy újévi tanulmány is egy sajtóorgánum számára. Szintén messze a reklámtól, de mégis. Ilyen ételeket böjtöltek az emberek az újévre:

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Itt is életkor szerinti bontásban. Látható egy olyan összefüggés, hogy a fiatalok többnyire ételt rendelnek, a felnőttek többnyire hagyományos asztalt készítenek. Vicces dolog, de ha márkatulajdonosként képzeljük el, rengeteg dolgot értékelhetünk: ki és hogyan kezeli a terméket, mit ír róla. Az emberek gyakran nem mindig említik magát a márkát a szövegben, és a hagyományos analitikus megfigyelő rendszerek nem mindig tudják megérteni és megtalálni a márka említését pusztán azért, mert nem szerepel a szövegben. Vagy hibásan írták a szöveget, nincsenek hash tagek vagy ilyesmi.

A fotók láthatóak. A fényképezéssel megállapíthatja, hogy ez a keret középső témája, vagy nem a keret középső témája. Akkor láthatod, mit írt ez a személy. De leggyakrabban olyan potenciális közönségek keresésére használják, akik bizonyos autókat vezettek és így tovább. És akkor sok érdekes dolgot fogunk csinálni ezekkel az autókkal.

A robotokat arra tanítják, hogy utánozzák az embereket

Volt egy ilyen lehetőség az emberek számlálására is:

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Lehetőség van az emberek összehasonlítására, amikor meg kell találni az embereket néhány fénykép segítségével, megérteni a közösségi profiljukat, hogy kik ők. Ismét visszatérünk ahhoz a kérdéshez, hogy ha van egy kameránk egy offline üzletben, akkor ez egy meglehetősen jó módja annak, hogy megértsük, kik jönnek Önhöz, kik ezek az emberek, mi érdekli őket, mi késztette őket arra, hogy hozzád forduljanak. .

Következik a legérdekesebb dolog: ha összegyűjtjük a fiókjaikat a közösségi oldalakon, megértjük, kik ezek az emberek, mi érdekli őket, akkor (opcióként) készíthetünk ezekhez az emberekhez hasonló botot; ez a bot úgy kezd el élni, mint ezek az emberek, és elemzi, hogy milyen hirdetéseket lát a különböző közösségi hálózatokon. Ez lehetővé teszi, hogy pontosan megértse, mely márkák célozzák ezt a személyt. Ez is elég gyakori történet, amikor nem csak azt kell elemezni, hogy ki ez a személy és milyen érdeklődési körei vannak, hanem azt is, hogy a potenciális versenytársak vagy más érdeklődők milyen reklámot céloznak meg.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Kapcsolatok elemzése a közösségi hálózatokban

Arthur Khachuyan: „Valódi nagy adat a reklámban”

A következő érdekesség az emberek közötti kapcsolatok elemzése. Tulajdonképpen a hálózatban lévő kapcsolatok elemzése, ezek a hálózati grafikonok - nincs ebben semmi újdonság, ezt mindenki tudja.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

De a hirdetési feladatokra való alkalmazás a legérdekesebb. Ez olyan emberek keresése, akik trendeket határoznak meg, olyan emberek keresése, akik bizonyos kritériumok szerint terjesztenek információkat ezen a hálózaton belül. Tegyük fel, hogy egy bizonyos BMW-modell ugyanazon tulajdonosai iránt érdeklődünk. Ezeket összefogva megtalálhatjuk azokat, akik irányítják a közvéleményt. Ezek nem feltétlenül autóipari bloggerek és így tovább. Általában egyszerű elvtársakról van szó, akik különféle nyilvános oldalakon ülnek, érdeklődnek bizonyos tartalmak iránt, és nagyon rövid időn belül képesek arra, hogy a márkáját vagy valakit, aki érdekli Önt, erre a felelősségi körre, a kamat.

Itt van egy ilyen példa. Vannak potenciális embereink, kapcsolataink az emberek között. Itt a narancssárgák emberek, a kis pöttyök közös csoportok, közös barátok.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Ha összegyűjtöd ezeket a kapcsolatokat köztük, akkor nagyon jól látható, hogy vannak emberek, akiknek nagyszámú közös csoportjuk, közös barátjuk van, ott vannak egymás között... És ha ugyanezt a vizualizációt érdeklődési körök szerint csoportokra osztjuk, tartalom szerint, amit terjesztenek, mennyit kommunikálnak egymással... Itt látható, hogy az előző kép ilyen lett:

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Itt a csoportok szín szerint egyértelműen megkülönböztethetők. Jelen esetben a Közgazdasági Főiskola mesterszakos hallgatóiról van szó. Itt látható, hogy a lilák/kékek azok, akik szeretik a Transparency Internationalt, az Open Russia-t és Hodorkovszkij nyilvános oldalait. Balra lent a zöldek, azok, akik szeretik az Egyesült Oroszországot.

Látható, hogy az előző kép ilyen volt (ezek csak emberek közötti kapcsolatok), de egyértelműen elhatárolódott. Vagyis minden ember mindig kapcsolatban áll egymással, azonos az érdeklődési körük, barátkoznak egymással. Vannak fent, mások alul, és néhány más elvtárs ott. És ha ezeket a kis részgráfokat külön-külön megjelenítjük más paraméterekkel, és megnézzük a tartalom terjedésének sebességét (nagyjából azt, hogy ki mit posztol újra ott), akkor mindegyik részben találhat egy-két olyan embert, aki mindig a kezében tartja a közvéleményt, interakció, amellyel valamilyen bejegyzést kér, vagy valami mást - választ kaphat ettől az érdekes közönségtől.

Van még egy ilyen példám. Szintén egy grafikon: ezek a BBDO csoport alkalmazottai, akik példaként a közösségi oldalakon találhatók. Érdektelennek tűnik, nagy, zöld, kapcsolat van köztük...

Arthur Khachuyan: „Valódi nagy adat a reklámban”

De van egy lehetőségem, ahol már csoportok épülnek fel közöttük. Aztán ha valakit érdekel, van egy interaktív változat is - kattinthat és nézegetheti.

Jobbra fent azok, akik szeretik Putyint. Itt a lilák a tervezők; akiket érdekel a design, valami érdekes stb. Itt a fehér dolgok a vezetői csapat (nyilván, ahogy értem); Ezek olyan emberek, akik általában semmilyen módon nem kapcsolódnak egymáshoz, de megközelítőleg azonos pozíciókban dolgoznak. A többi a közös csoportjaik, kapcsolataik stb.

A márkáknak nem bloggerekre van szükségük, hanem véleményvezérekre

Fogjuk ezeket az embereket és megkeressük őket – majd a reklámügynökség, a reklámcég maga dönti el: tud pénzt adni ennek az embernek, hogy valamilyen módon kapcsolatba kerüljön ezzel a tartalommal, valami mással, vagy rájuk irányítsa a saját konkrét reklámkampányát. Ezt is elég gyakran használják, főleg most, mert minden márka szeretne együtt dolgozni a bloggerekkel, szeretné, ha a tartalmait népszerűsítenék, de a reklámügynökségek nem nagyon akarják felvenni a kapcsolatot (na, ez előfordul).

És az igazi kiút ebből a helyzetből az, ha olyan embereket találunk, akik nem bloggerek, nem szépségbloggerek, hanem például néhány valódi lény, akik kapcsolatba lépnek ezzel a márkával, és beírhatják valami nyomorult nyilvános oldalra, hogy „Mail.ru Answers”, bizonyos számú megtekintés. Ezek az emberek, akik folyamatosan érdeklődnek ennek a személynek a tartalma iránt, terjesztik az egészet, és a márka is bevonódik.

Az ilyen technológia használatának második lehetősége most meglehetősen releváns - a kedvencem a botok keresése. Ez hírnévkockázatot jelent a versenytársai számára, és egy lehetőség arra, hogy kiszűrje az irreleváns személyeket egy reklámkampányból, és bármi másból (kommentek törlése, emberek közötti kapcsolatok keresése). Van egy ilyen példám, ez is nagy és interaktív - mozgatható. Ezek olyan emberek kapcsolatai, akik megjegyzéseket írtak a Lentach közösségben.

Ez a példa arra szolgál, hogy megértse, milyen jól és könnyen láthatóak a robotok; ehhez pedig nem kell semmilyen műszaki ismerete. Ez azt jelenti, hogy Lentach közzétett egy bejegyzést az FBK nyomozásáról Dmitrij Medvegyevről, és bizonyos emberek kommenteket kezdtek írni. Összegyűjtöttük az összes megjegyzést író embert – ezek zöldek. Most áthelyezem:

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Az emberek a zöldek (akik írták a kommenteket). Itt vannak, itt vannak. A köztük lévő kék pontok a közös csoportjaik, a sárga pontok a közös előfizetőik, barátaik stb. Az emberek nagy része kapcsolatban áll egymással. Mert bármi legyen is a három, négy, öt kézfogás elmélete, a közösségi oldalakon minden ember kapcsolatban áll egymással. Nincsenek egymástól elválasztott emberek. Még a szociálisan fóbiás barátaim is, akik a VKontakte-ot kizárólag videók nézésére használják, még mindig ugyanazokra a nyilvános oldalakra vannak feliratkozva, mint mi.

Navalnij botokat is használ. Mindenkinek vannak botjai

Az emberek nagy része (itt van, itt) kapcsolatban áll egymással. De van egy ilyen kis csoport az elvtársaknak, akik kizárólag egymással barátkoznak. Itt vannak ők, a kis zöldek, itt vannak a közös barátaik, csoportjaik. Itt még külön is leestek:

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Szerencsés egybeesés folytán pontosan ezek az emberek írták e bejegyzés alá: „Navalnijnak nincs bizonyítéka” és így tovább, és ugyanazokat a megjegyzéseket írták. Természetesen nem merek következtetéseket levonni. De ennek ellenére volt egy másik bejegyzésem a Facebookon, amikor Lebegyev és Navalnij között vita volt, ugyanúgy elemeztem a kommenteket: kiderült, hogy akik azt írták, hogy Lebegyev szar, azok nem voltak közösségi oldalon. hálózat a közelmúltban négy hónapja, nem iratkozott fel egyik nyilvános oldalra sem, hirtelen erre a bejegyzésre ment, pontosan ezt a megjegyzést írta, és elment. Innen megint nem lehet következtetéseket levonni, de valaki Navalnij csapatából írt nekem egy megjegyzést, hogy nem használnak botokat. Hát rendben!

Közelebb a reklámhoz, közelebb a márkához. Most mindenkinek van botja! Megvannak nekünk, versenytársainknak és másoknak is. Ki kell dobni, vagy hagyni kell őket, hogy jól éljenek; Az ilyen adatok alapján (az előző diára mutat) tökéletesítse őket, hogy valódi embereknek tűnjenek, és csak ezután használja őket. Bár a botok használata rossz! Ennek ellenére elég gyakori történet...

Automatikus módban egy ilyen dolog lehetővé teszi, hogy kiszűrje az elemzésből az elemzés szempontjából irreleváns személyeket, illetve azokat, akiket nem szabad a mintába bevonni, nem kerülhet be a vizsgálatba. Nagyon gyakran használt. Ugyanakkor igazából nem minden autótulajdonos rendelkezik autóval. Néha az embereket csak azok érdeklik, akiknek esetleg van autójuk, akik valamilyen csoportban ülnek, kommunikálnak valakivel, ott van egy bizonyos közönségük.

Tények és vélemények elemzése

A következő is a kedvencem. Ez a tények és vélemények elemzése.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Manapság mindenki tudja, hogyan kell megemlíteni a márkáját különféle forrásokban. Ennek nincs titka. És úgy tűnik, mindenki ki tudja számolni a tonalitást... Bár személy szerint én úgy gondolom, hogy maga a tonalitási mérőszám nem túl érdekes, mert amikor odajön és azt mondja az ügyfélnek, hogy „Ember, 37%-a semleges”, és ő ezt mondja. , " Azta! Menő!" Ezért érdekesebb lenne egy kicsit továbblépni: a hangulat felmérésétől a termékről elmondottak véleményének felméréséig.

És ez is egy nagyon érdekes dolog, mert... Én személy szerint úgy gondolom, hogy elvileg nem létezhetnek semleges üzenetek, mert ha az ember ír valamit a nyilvános térben, akkor ez az üzenet valahogyan színezett. Én személy szerint soha nem láttam semleges üzenetet, amely márkát említ. Általában valami szennyeződés.

Ha nagyszámú ilyen üzenetet veszünk (lehet több millió, 10 millió), kiemeljük az egyes üzenetekből a fő gondolatot, kombináljuk őket, akkor elég megbízhatóan megérthetjük, mit mondanak az emberek erről a márkáról, mit gondolnak. „Nem szeretem a csomagolást”, „Nem szeretem az állagot” és így tovább.

Mit gondolnak az emberek Transaeróról, Chupa Chupsról és az Egyesült Államok elnökéről?

Van egy vicces példám: ez egy infografika arról, hogy a közösségi oldalak felhasználói mit kezdenének a Transaero céggel annak csődje után.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Sok érdekes példa van erre: égess, ölj, deportálj Európába, sőt 2% volt, aki azt írta: "Küldje el őket Szíriába katonai műveletekre." Továbblépve a viccesen, szinte bármilyen márka lehet - a kedvenc kutyaeledeltől néhány autóig. Aki nem szereti a csomagolást, aki nem szereti a valódi dolgokat – ezzel mindig lehet dolgozni, ezt mindig figyelembe tudja venni. Nagyon sok példa van arra, amikor az emberek majdnem megváltoztatták termékeik gyártását, mert azt írták a közösségi oldalakon, hogy a Chupa Chups nem elég gömbölyű, vagy nem elég édes.

Van még egy vicces példa. Találd ki, milyen megjegyzéseket és kiről?

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Valamiért ma már a vélemények elemzése, az üzenetekből kinyert tények elemzése nem túl gyakori és nem túl elterjedt. Bár ez a technológia nem szupertitkos, gyakorlatilag nincs benne know-how, mert az emberek megjegyzéseiből az alany, predikátum kiemelése és csoportosítása nem igényel számítógépes nyelvészet zsenijét. Nem olyan nehéz megtenni. De remélem, hogy a következő pár évben az emberek elkezdik ezt használni, mert... Klassz lesz - ez ilyen automatikus visszajelzés! Mindig tudod, mit mondanak rólad. Nos, tudod, hogy ez az Egyesült Államok elnökéről készült.

Válasz a közönség kérdésére:

  • Igen, ez a Facebook angolul. Itt vannak lefordítva oroszra. Ezt írták valahol.

Big Data és politikai technológiák

Valójában sok érdekes példám van a politikáról Trumpról és mindenki másról, de úgy döntöttünk, hogy nem hozzuk ide. De van egy politikai példa.

Ezek az Állami Duma választásai. Mikor voltál? Tavaly? Majdnem másfél éve.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Itt vannak olyan emberek, akik meg tudták határozni pontos helyüket egy bizonyos földrajzi pontig, hogy megértsék, melyik választókörzetbe esnek. És akkor ezek közül az emberek közül csak azokat vették ki, akik határozott véleményt nyilvánítottak, akikre szavazni fognak.

Politikatechnikai szempontból ez nem túl korrekt, mert ezt az egészet normalizálni kell a népsűrűség stb. Ennek ellenére itt a kékek kire fognak szavazni, a vörösök az ellenzéki elvtársakra, akikből egyébként nem is volt sok.

Én személy szerint úgy gondolom, hogy a Big Data egyhamar nem jut el a politikai technológiákhoz, de lehetőségként a jelölt egy márka is. És ez bizonyos mértékig a márkával kapcsolatos tények és vélemények elemzése is, és egy meglehetősen érdekes dolog, mert valós időben megértheti, hogy ki mit csinál. A BBC-től több olyan esetet is ismerek, amikor valamelyik adásban valós időben figyelték a közösségi hálózatokat: volt ilyen és olyan válasz, az emberek írnak róla, tesznek fel ilyen-olyan kérdést - és ez nagyszerű! Szerintem nagyon hamar használható lesz, mert mindenki számára érdekes.

Márkapozíciók modellezése

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Következő a márkapozíciók modellezése. Egy kis, rövid cikk arról, hogyan rangsorolhatod a márkákat különféle mérőszámok segítségével (nem a közösségi oldalakon lévő feliratkozók kedvelése, hanem összetett mérőszámok, a tartalom iránti érdeklődés, a mérőszámok fogadására fordított idő).

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Van egy példám a „pharma” kifejezésre, bizonyos okból. Itt a kis körök belsőek, fényesek - ennyi szöveges tartalom, amit maga a márka hoz létre, a nagy kör az a fotó- és videótartalom mennyisége, amelyet maga a márka hoz létre.

A központ közelsége mutatja, mennyire érdekes a tartalom a közönség számára. Van egy nagy modell, van egy rakás mindenféle paraméter: lájkok, repostok, válaszidő, ki osztott meg ott átlagosan... Itt láthatod: van egy csodálatos „Kagotsel”, ami hatalmas mennyiséget pumpál. pénzt saját tartalom létrehozására, és ennek köszönhetően meglehetősen közel vannak a központhoz. És vannak olyan elvtársak, akik saját tartalmat is készítenek, de a közönséget ez nem érdekli. Ez nem túl megfelelő példa, mert ezek a beszámolók gyakorlatilag halottak.

Yegor Creedet jobban szeretik, mint Bastát

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Sajnos a többi... abból, hogy mit mutasson... Hát ott vannak orosz rapperek is, opcióként, igazi cégektől.

Mi a plusz? A helyzet az, hogy egy cég szinte bármit bele tud építeni egy ilyen modellbe, kezdve a márkájának dolgozó előfizetőinek átlagfizetésétől; bármilyen modellt szeretnek. Mivel minden reklámügynökség másként számítja ki a saját mérőszámait, a márkák másként számítják ki saját mérőszámaikat.

Itt is van egy - a Basta, amely nagy mennyiségű tartalmat generál, de a periférián helyezkedik el, mert ez a tartalom láthatóan nem túl érdekes a közönség számára. Még egyszer mondom, nem akarok ítélkezni. Ennek ellenére ott van Yegor Creed, aki a közösségi hálózatok szerint szinte korunk legjobb előadója, de csak személyes fényképeit teszi közzé. Ennek ellenére nagy számú előfizetője van: valahol egymillió körül vannak. Nem emlékszem a pontos számra; Emlékszem, hogy ezeknek az embereknek az elköteleződési aránya jóval magasabb, mint 85%, azaz millió előfizetőre vetítve 850 ezer választ kap ezektől a valódi emberektől - ez igazi őrület. Ez igaz.

Arthur Khachuyan: „Valódi nagy adat a reklámban”

Válaszok a hallgatóság kérdéseire:

Mennyi ideig tartott a rapperelemző modell elkészítése?

  • Mindegyiknek megvan a saját célközönsége, ezeknek az embereknek az érdeklődési köre mindegyikre ki van számolva... Mindez nagyjából a középpont távolságára van normalizálva, a sugárirányú helyzetük nem fontos (egyszerűen bekenik itt a szépség miatt, hogy így legyen nem futnak össze). Csak a központ hozzávetőleges közelsége a fontos. Ezt a modellt használjuk. Például a kört jobban szeretem, van aki félkörnek gondolva csinálja.
  • Ezt a modellt gyorsan, két-három óra (igen, egy személy) alatt összeállították. Ide csak a mérőszámok kerültek be: mit szorozunk meg mivel, összeadjuk, majd valahogy normalizáljuk. Modelltől függ. Vannak, akiket az előfizetőik átlagfizetése (ez nem vicc) érdekel. És ehhez meg kell találni az elérhetőségeiket, Avito, mindent ki kell számítani, meg kell szorozni. Előfordul, hogy ennek figyelembevétele sokáig tart, de konkrétan ez (az előző diára mutat) - a paraméterek itt nagyon egyszerűek: előfizetők, újraküldések stb. Körülbelül két-három órát vett igénybe. Ennek megfelelően ez a dolog valós időben frissül, és használhatod.

Most jön a szórakoztató rész. Kész vagyok a példákkal, mert nem érdekes sokáig beszélgetni egyedül. És remélem, hogy most kérdéseket fog feltenni, sőt, témáról témára fogunk haladni, mert vannak ilyen példáim a technológiák használatára és így tovább...

Válaszok a hallgatóság kérdéseire:

  • Egyetlen személyes esetem volt egy, mondhatni „kaszinóközeli”-vel, amikor egy kamerát tettek oda, felismerték az arcokat, stb. Az elismert emberek aránya határozottan igen magas – mind a miénk, mind a versenytársaink. De valójában nagyon érdekes. Érdekes dolognak tartom ezt: meg lehet érteni, kik ezek az emberek, és elég jól megjósolhatod, hogy pontosan miért jöttek ide, mi változott meg annyira az életükben, hogy a kaszinó mellett döntöttek. De ami a konkrét üzlettípusokat illeti... Ha egy ilyen dolgot elhelyez egy gyógyszertárban, akkor nincs értelme - nem lehet megjósolni, miért jött az ember a gyógyszertárba.

    A globális feladat itt egy modell felépítése volt annak megértésére, hogy egy személy potenciálisan mikor akar érdeklődni a márkája iránt, így Ön nem azután adhat neki reklámot, hogy megvett valamit (mint ahogy most történik), hanem reklámozza őt. előrejelzésben”, hogy mikor fog mindez megtörténni. Érdekes volt egy ilyen „kaszinóközeli”; kiderült, hogy ezeknek az embereknek elég érdekes százaléka - miért: valaki hirtelen előléptetést kapott, valaki mást kapott - ilyen érdekes meglátások. De néhány üzlettel, kiskereskedelemmel, valamilyen tablettát árusító bolttal úgy tűnik számomra, hogy ez nem lesz túl helyes.

Offline használják a Big Data-t?

  • Offline volt. Csak pontosan, nagyjából meg kell értenie, hogy ez a modell megfelel-e vagy sem. Megint szénsavas vízzel... Igazából minden érdekel, de személy szerint nem értem, hogy ezeknek az embereknek a profilja, viselkedése mennyire, mennyire múlhat azon, hogy mikor akarnak palackozott vizet venni. Bár ez tényleg igaz lehet, nem tudom.

Hány nyitott közösségi média fiók van?

  • Konkrétan 11 közösségi hálózatunk van - ezek a „Vkontakte”, „Facebook”, „Twitter”, „Odnoklassniki”, „Instagram” és néhány apróság (megnézhetem a listát, például „Mail.ru” és így tovább) . A VKontakte-n minden bizonnyal van egy példányunk ezekről az elvtársakról. Vannak embereink a VKontakte-on – ez 430 millió mindenkit, aki valaha is létezett (ebből körülbelül 200 millió folyamatosan aktív); vannak csoportok, vannak kapcsolatok ezek között az emberek között és van minket érdeklő tartalom (szöveg), meg a média egy része, de nagyon kicsi... Nagyjából ezt a képet nézzük: ha vannak ott arcok, akkor mi mentsük el őket, ha van mém, elmentjük Nem mentjük el, mert még nekünk sem lenne elég a médiatartalom mentéséhez.

    Van egy orosz nyelvű Facebook. Valahol most 60-80% az Odnoklassniki, pár hónap múlva valószínűleg mindet a végére érjük. Orosz Instagram. Mindezen közösségi hálózatok számára vannak csoportok, emberek, kapcsolatok közöttük és a szöveg között.

  • Körülbelül 400 millió ember. Van egy finomság: vannak emberek, akiknek városa nincs megadva (lehet, hogy oroszok/nem oroszok); Ebből a közösségi hálózatok átlaga a VKontakte lezárt fiókjainak 14%-a, a Facebookon nem tudom a pontos adatot.
  • Az Instagramra sem mentjük a médiát – csak akkor, ha ott vannak arcok. Ilyen (egyéb) médiatartalmakat nem tárolunk. Általában érdekes: csak szöveg, emberek közötti kapcsolatok; Minden. A leggyakoribb kutatás az Instagramon a szokásos közönségkutatás: kik ezek az emberek, és ami a legfontosabb, ezeknek az embereknek a kapcsolata más közösségi hálózatokkal. Keresse meg ennek a személynek a profilját a Vkontakte-on és a Facebookon, hogy kiszámítsa az életkorát és így tovább.
  • Még nem kell mindenki mást vállalni – egyszerűen azért, mert nincsenek vevők. Ami a nyelvet illeti: van orosz, angol, spanyol, de továbbra is ez kizárólag az oroszországi márkáknál használatos; nos, vagy az őket Oroszországból hozó cégek.
  • Naponta sok-sok-sok szálban interjúzunk embereket: a weben gyűjtjük az adatokat, és frissítjük ezeket a mutatókat az Api segítségével. 2-3 nap alatt végigjárhatja a teljes „VKontakte”-t, végighaladva rajtuk; Körülbelül egy hét alatt végigjárhatod a Facebook egészét, és megértheted, hogy ki mit frissített és mit nem. Utána pedig állítsd össze ezeket az embereket külön: mi változott pontosan, írd le ezt az egész történetet. Tapasztalataim szerint nagyon ritkán használták fel valakinek a régi közösségi média profilját valódi üzleti célra. Ekkor jelentkezett egy politikus, akinek az volt a feladata, hogy megértse, milyen emberek jönnek a központba, kik voltak ezek az emberek 6-8 hónapja (törölték a profiljukat, de valójában egy másik jelöltre érkeztek szavazólapok) zsákmány).

    És néhányszor - személyes történetek, amikor valakinek a fényképeit nyilvánosságra hozták. Összefüggéseket kellett keresni stb. Sajnos kár, de bíróság előtt nem tudunk tanúskodni, mert adatbázisunk jogilag illikvid.

  • A MongoDB tárhely a kedvencem.

A közösségi hálózatok az adatgyűjtés ellen próbálnak küzdeni

  • Általában ezeknek a fiókoknak csak egy listáját töltjük fel a hirdetőknek, majd ők a szokásosat használják... Vagyis a közösségi hálózatokon, a VKontakte-on megadhatja ezeknek az embereknek a listáját.

    A Facebook azonban vásárolt sütiket használ. Mi magunk nem dolgozunk sütikkel, de volt több olyan történet is, amikor a hirdető maga adott néhány embert, kapcsolatba léptünk velük – vannak ilyen hálózataik, kedvcsináló, nem teaser reklámmal, ezekkel a „sütikkel”. Meg tudod kötni – nem kérdés! De nem igazán szeretem ezt a cuccot, mert szerintem nem túl hiteles. Ez pusztán az én véleményem szerint olyan, mint a TNS, ami „követi” a tévéket – nem világos, hogy ezt a tévét nézed-e vagy sem, mosogatsz-e, miközben be van kapcsolva a tévéd... És ez itt is így van : Nagyon gyakran keresek a google-ban valamit az interneten, de ez nem jelenti azt, hogy meg akarom venni.

  • Ha valamilyen szabványos kontextuális hirdetési hálózatot használ: több történetem is volt, amikor ezeket az embereket kiraktuk nekik, és a felületeik segítségével megpróbáltuk összekapcsolni őket "cookie-kkal" az oldalukon. De nem igazán szeretem az ilyeneket.

Képlet az internethasználó fizetésének kiszámításához

  • Az átlagkereset általános képlete: ez az a régió, ahol az ember él, ez az a vállalkozási kategória, amelyben dolgozik (vagyis a munkáltatója a cég), akkor ebben a cégben elfoglalják a pozícióját, az átlag ennek a pozíciónak a fizetése becsült... A „Fejvadász” és a „Superjob” (és számos más forrás) átlagkeresete egy adott régióban és egy adott üzleti környezetben lévő adott álláshelyre.

    Az „Avito” és az „Avto.ru” oldalakból általában további paramétereket vesznek, ha valaki megvilágította a telefont. Az Avito segítségével láthatja, hogy az ember milyen dolgokat árul – drágát, olcsót, használtat, nem használtat. Az "Avto.ru" segítségével láthatja, hogy van-e autója - az övé, nem. Ez valahol kevesebb, mint 20%-a azoknak az embereknek, akik véletlenül leejtették valahol a telefonját, és a fiókjuk összekapcsolható ezekkel az adatokkal.

Milyen mennyiségben működik az adatgyűjtő cég?

  • A tárolt fényképek mennyisége petabájtban 6,4. A növekedés ütemét most nem tudom pontosan megmondani, mert 2016-ban elkezdtük a „periszkópok” rögzítését, és most kezdtük el a videózást.

    Pontosan nem tudom megmondani, mikor volt nulla. Vállalatról társaságra költöztünk – ezek mind hosszú történetek. De azt mondhatom, hogy a VK, a Facebook, az Instagram és a Twitter – ez az egész üzlet (emberek, csoportok és köztük lévő kapcsolatok) szöveggel és tartalommal – ez valójában nem sok adat, nem valószínű, hogy egy petabájt is elég. Szerintem 700 gigabájt, valószínűleg 800.

Segít az ügyfeleknek meghatározni az aktuális rést, és hol kell ásni?

  • Ha jön egy ügyfél, ilyeneket javasolunk neki, de mi magunk, mint a Google Trends, nem teszünk ilyesmit.
  • Volt több szociológiához közeli történetünk, választási, választás előtti történettel – mindezt elemeztük. A márkákkal és a márkákról alkotott véleményekkel kapcsolatban szinte mindig minden megegyezik. Itt vannak választási-választási történetek – nem (egy jelölt értékelésével, hogy melyik jelölt nyerjen). Nem tudom, ki téved itt – mi, vagy azok, akik a VTsIOM-ban gondolkodnak.
  • Általában magától a márkától vesszük ezeket az ellenőrzési eredményeket, és olyan elvtársaktól veszik, akik kutatást rendelnek - telefonos kutatás, marketingkutatás stb. Ráadásul ez az egész alap dolgokkal ellenőrizhető: valaki válaszolt a levelezőlistára, valaki felméréseket készített... Ha nagy márkáról van szó (például Coca-Cola), akkor biztosan van egy-két millió belső véleményük a vásárlóktól. – ezek nem csak a közösségi oldalakon megjelenő megjegyzések és néhány vélemény; Ezek valamiféle belső rendszerek, áttekintések stb.

A törvény nem „tudja”, hogy mi a személyes adat!

  • Kizárólag nyílt adatforrásokat elemezünk, és soha nem keveredünk bele semmilyen piszkos trükkbe. Modellünk arra épül, hogy az összes nyílt adatot néhány nyilvános adatközpontban tároljuk, máshol béreljük, és otthon, irodánkban, szervereinken elemezzük, és a területen kívülre nem kerül sehova.

    A nyílt adatokkal kapcsolatos jogszabályaink azonban nagyon homályosak.

    Nem értjük világosan, mi a nyílt adat, mi a személyes adat – létezik ez a 152. szövetségi törvény, de mégis... Hogyan számítanak? Most, ha az egyik adatbázisban megvan a neved és a telefonszámod, egy másik adatbázisban megvan a telefonszámod és az e-mailed, a harmadikban pedig mondjuk az e-mailed és az autód; Úgy tűnik, hogy mindez nem személyes adat. Ha mindezt összeadja, úgy tűnik, hogy a törvény szerint személyes adattá válik.

    Ezt kétféleképpen kerülhetjük meg. Az első az, hogy telepíteni kell egy szervert szoftverrel az ügyfél számára, majd ezek az adatok nem lépnek túl a területén, majd az ügyfél felelős ezeknek a személyes adatoknak, nem személyes adatoknak stb. Vagy a második lehetőség: ha ez egy olyan történet, ahol be kell perelni egy közösségi oldalt vagy valami mást...

    Volt egy ilyen tanulmányunk, amikor összegyűjtöttük (voltak az Egyesült Oroszország előválasztások) a Lifenews számára ezeknek az elvtársaknak a beszámolóit, és megnéztük, milyen pornót szeretnek. Vicces volt, de akkor is. Ezt saját, személyes véleményünkként adjuk el, anélkül, hogy a dokumentumokban jogilag nyilvánosságra hoznánk, amit elemeztünk - a jogi személyek egységes állami nyilvántartását, fizetéseket, közösségi hálózatokat; Szakvéleményt adunk el, majd a pálya szélén elmagyarázzuk az illetőnek, hogy mit és hogyan elemeztünk.
    Több történet is volt, de ezek néhány nyilvános kereskedelmi projekthez kapcsolódtak. Például van egy ingyenes non-profit projektünk azoknak, akik longboardon ülnek (az ilyen táblák hosszúak): a feladat az volt, hogy összegyűjtsük az emberek publikációit – amikor valaki közzéteszi: „Elmentem a Gorkij Parkba lovagolni”. És most fel kell kerülnie a térképre, és a körülötte lévők láthatják, hogy valaki van a közelében. A VK nagyon sokáig törte velünk a fejét ezen a témán, mert nem tetszett nekik, hogy ezt az információt az emberek engedélye nélkül tesszük közzé. De aztán nem került bíróság elé az ügy, mert több nagy közösségen belül is hozzáírtuk a szabályokhoz, hogy az adatokat harmadik felek, ügynökségek, cégek, elemzések stb. használhatják. Persze ez nem volt különösebben etikus, de mégis.

  • Épp időben rájöttünk, és elkezdtük mindenkinek eladni szakértői véleményünket.

Együttműködik oktatási intézményekkel?

  • Együttműködünk oktatási intézményekkel, igen. Van egy egész sorunk: van mesterképzésünk a Felsőiskolában, és együttműködünk más egyetemekkel. Nagyon szeretjük az egyetemeket!
  • Ha megvan az elérhetőségeim, írhatsz nekem. És egy link az előadáshoz, ha valakit érdekel - ezek a példák mind ott vannak, áthelyezheti.
  • Ha ismeri a telefonszámot, e-mailt - ez majdnem száz százalékos lehetőség, senki sem fogja eltávolítani. Ha nincs telefonszám, akkor általában kép, ha nincs kép, akkor évszám, lakhely, munkahely. Vagyis év, lakóhely és munkahely szerint szinte mindenkit mindig elég finoman be lehet azonosítani. De ez ismét a feladattal kapcsolatos kérdés.

    Van mondjuk egy ügyfelünk, aki internetes televíziózást árul. Valaki előfizetést vásárolt tőlük ezekre a „Games of Thrones”-ra, és a feladat az, hogy a CRM-jük segítségével megtalálja ezeket az embereket a közösségi hálózatokon, majd megtalálja a potenciálisakat a befolyási területükről. Csak arra gondolok, hogy mondjuk van egy keresztnevük, egy vezetéknévük és egy e-mail címük... És akkor nagyon nehéz bármit is csinálni. A legtöbb esetben az emberek e-mailben megtalálhatók.

  • Barátaink összetétele alapján általában a közösségi oldalakon szoktunk embereket „megegyezni”, de ez nem mindig helyes. Nem arról van szó, hogy ez nem mindig helyes – nem mindig működik. Először is, ez sok munkát igényel, mivel ezt a műveletet (emberek egyeztetését) először minden barátnál el kell végezni - annak megértéséhez, hogy a közösségi hálózatokból származnak-e vagy sem. És akkor - senki számára ismeretlen tény, hogy a VKontakte-ban ugyanazok a barátaink, a Facebookon pedig különböző barátaink. Nem mindenkinek, de nekem például ilyen; és ez a legtöbb emberre is igaz.

Hogyan történik a legteljesebb adatgyűjtés?

  • Szoftver telepítése az ügyfél oldalán. Szerver van rájuk telepítve, amely csak nyilvános adatokat vesz át tőlünk, és személyes adataikat belsőleg dolgozza fel. Az ügyféllel NDA-t kötnek. Ez persze nem túl helyes, hogy ezt átadják nekünk, de a jogi felelősség az ügyfelet terheli - hát, hogy szoftvert telepít neki, vagy névtelen adatokat továbbít. De ez nagyon ritka volt, mert - helyes vagy helytelen anonimizálás - a legtöbb esetben megszűnik a függőség ezen emberek között.

Ki vásárol arcfelismerő szoftvert?

  • Valójában azért megyünk ide, mert az általunk forgalmazott fő szoftverünk az arckeresés, a korrelációelemzés, és ezt eladjuk kormányzati szerveknek. Másfél éve pedig úgy döntöttünk, hogy mindezeket a történeteket a reklámba, a marketingbe, a nyilvános piacra tesszük – így jött létre a Social Data Hub, egy kereskedelmi jogi személy. És csak most jövünk ide. Már másfél éve itt lógunk, és próbáljuk elmagyarázni az embereknek, hogy nem kell megemlítéssel letölteni az embereket, választ kell adni a kérdésekre, nincs szükség tonalitásra. , stb. Szóval nehéz megmondani, hol...
  • (Kire gondol?) Minden elvtársnak, akinek terroristákat és pedofilokat kell keresnie.
    Rögtön kijelenthetem (ez lesz a következő kérdés): adataink szerint egyetlen tanár sem került börtönbe újraküldés miatt.
  • A VKontakte-on - 14%; a Facebookon nincs zárt profil mint olyan (van egy zárt baráti lista és így tovább). És a legérdekesebb az, hogy most írtam egy üzenetet - most számolnak és mondanak.

Ne posztolj olyat, amit szégyellni fogsz!

  • Ne tegyél közzé semmit a közösségi oldalakon, ami szégyellné – én személy szerint követem ezt. Bár volt egy csomó személyes, mert a Facebookon esküszöm. Nos, volt és volt mit tenni... Ne posztolj olyat, ami kínos lenne! Ha később valahol a Közkamarában fog dolgozni, igen, jobb, ha nem nyilatkozik. Ha ezt nem fogja megtenni, akkor nagyjából senkit sem érdekel. Csak biztosíthatom, hogy senki nem olvassa el a személyes levelezését, és mindez építi fel ezt az egész történetet...

    Minden héten valaki határozottan odajön hozzám, és azt mondja: „Nos, a barátom fotói kiszivárogtak valamelyik névtelen nyilvános oldalra! Segítség! Egyébként soha ne tegyél közzé semmit anonim nyilvános oldalakon.

  • A többi megfigyelő rendszerről nem tudok - ezt mindenképpen figyelembe vesszük, hogy a márka említése negatív volt, Isten bocsássa meg... De azt tudom mondani, hogy mindenféle államközeli elvtársat csak az ember érdekli. akiknek több mint 5 ezres közönsége van és közvéleményük befolyásolhat valakit.akkor befolyásolni. Tapasztalataim szerint még nem fordult elő, hogy a profilfelmérést tőlünk megrendelő HR ügynökség azt mondta volna: „Akinek tetszik Navalnij, ne vegyen fel senkit!”

Az eredmények közzétételéről. Hány embert foglalkoztatnak a kutatásban?

  • A 10 legjobb reklámcég közül most hét publikál. Nehéz megmondani: amikor másfél éve elkezdtük... Többen dolgozunk minden területen - többen vannak a bankokban, többen vannak a HR-ben, többen a reklámozásban. Most pedig azon gondolkodunk, hogy kihez éri meg előbb elmenni a jövedelmezőbbet, kinek kell elkezdeni valamilyen felületet készíteni...
  • (piaci szegmensenkénti létszámról) 25 főnél nem több, mert nem erőszakoltunk meg senkit.
  • Általánosságban elmondható, hogy elvileg ezeket a piacról származó technológiákat több mint 50%-ban használják. Hol a reklámkampányokban, hol a belső elemzésekben. Azt mondanám, 40 százaléka belső analitikában használja, 50-60 százaléka pedig végmárkáknak adja el. De ez már magukon a reklámcégeken múlik. Ugyanis van, aki pusztán az elköltött pénzért, a kihelyezett reklámokért tesz feljelentést, míg mások arról írnak, hogy hány embert hoztak el, milyen közönség... Mondanám, de lehet, hogy tévedek – nem. nem igazán képzeli el, hogyan dolgoznak ezek az elvtársak. Csak mennyiségi adatokból tudom.

Néhány hirdetés 🙂

Köszönjük, hogy velünk tartott. Tetszenek cikkeink? További érdekes tartalmakat szeretne látni? Támogass minket rendeléssel vagy ajánlj ismerőseidnek, felhő VPS fejlesztőknek 4.99 dollártól, a belépő szintű szerverek egyedülálló analógja, amelyet mi találtunk ki Önnek: A teljes igazság a VPS-ről (KVM) E5-2697 v3 (6 mag) 10 GB DDR4 480 GB SSD 1 Gbps 19 dollártól, vagy hogyan oszthat meg egy szervert? (RAID1 és RAID10, akár 24 maggal és akár 40 GB DDR4-gyel is elérhető).

A Dell R730xd kétszer olcsóbb az amszterdami Equinix Tier IV adatközpontban? Csak itt 2x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6 GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV 199 dollártól Hollandiában! Dell R420 - 2x E5-2430 2.2 Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99 dollártól! Olvasni valamiről Hogyan építsünk infrastrukturális vállalatot? osztályú Dell R730xd E5-2650 v4 szerverek használatával 9000 eurót ér egy fillérért?

Forrás: will.com

Hozzászólás