Arthur Khachuyan: “I veri Big Data nella pubblicità”

Il 14 marzo 2017, Arthur Khachuyan, CEO di Social Data Hub, è intervenuto alla conferenza BBDO. Arthur ha parlato di monitoraggio intelligente, creazione di modelli comportamentali, riconoscimento di contenuti fotografici e video, nonché di altri strumenti e ricerche di Social Data Hub che consentono di rivolgersi al pubblico utilizzando i social network e le tecnologie Big Data.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Arthur Khachuyan (di seguito – AH): - Ciao! Ciao a tutti! Mi chiamo Arthur Khachuyan, gestisco la società Social Data Hub e siamo impegnati in varie interessanti analisi intellettuali di fonti di dati aperti, campi di informazione e facciamo ogni tipo di ricerca interessante e così via.

E oggi i colleghi del Gruppo BBDO ci hanno chiesto di parlare delle moderne tecnologie per l'analisi dei big data, big e non così big data per la pubblicità: come vengono utilizzati, mostrano alcuni esempi interessanti. Spero che farai domande lungo il percorso, perché posso annoiarmi e non rivelare l'essenza e così via, quindi non essere timido.

In realtà, le direzioni principali, ovunque siano state utilizzate soluzioni "quasi big data", sono tutte chiare: si tratta di targeting del pubblico, analisi, conduzione di una sorta di ricerca di marketing analitica. Ma è sempre interessante quali dati aggiuntivi si possono trovare, quali significati aggiuntivi si possono trovare dopo aver applicato l’analisi.

Perché abbiamo bisogno della tecnologia per la pubblicità?

Da dove cominciamo? La cosa più ovvia è la pubblicità sui social network. Oggi l'ho tolto stamattina: per qualche motivo VKontakte pensa che dovrei vedere proprio questa pubblicità... Se sia buona o cattiva è la seconda domanda. Si vede che io rientro sicuramente nella categoria dei coscritti:

Arthur Khachuyan: “I veri Big Data nella pubblicità”

La prima e più interessante cosa che può essere intesa come soluzione tecnologica... La prima cosa che volevo decidere prima di iniziare è definire i termini: cosa sono gli open data e cosa i big data? Perché tutti hanno la propria opinione su questo argomento e non voglio imporre le mie condizioni a nessuno, ma... Giusto affinché non ci siano discrepanze.

Personalmente, penso che gli open data siano tutto ciò a cui posso accedere senza login o password. Questo è un profilo aperto sui social network, questi sono risultati di ricerca, questi sono registri aperti, ecc. Big Data, secondo me, lo vedo così: se è una targhetta dati, sono un miliardo di righe, se è di qualche tipo di archiviazione di file, si tratta di un petabyte di dati. Il resto nella mia terminologia non sono big data, ma qualcosa del genere.

Profilazione e scoring del profilo ad alta precisione

Andiamo con ordine. La prima e più interessante cosa che puoi ricavare dall'analisi delle fonti di dati aperti è la profilazione e il punteggio del profilo ad alta precisione. Cos'è questo? Questa è una storia in cui il tuo account di social network può prevedere non solo chi sei, non solo i tuoi interessi.

Ma ora, combinando varie fonti, puoi capire il livello medio del tuo stipendio, quanto costa il tuo appartamento e dove si trova. E tutti questi dati possono essere utilizzati letteralmente con i mezzi disponibili. Ad esempio, se prendi il tuo account su un social network, guarda, ad esempio, dove vivi, dove lavori; capire in quale settore del business si trova l'azienda per cui lavori; scarica offerte di lavoro simili da HH e “Superjob” se sei un analista, manager, ecc.; guarda dove vivi (base, diciamo CIAN), capisci quanto costa affittare una casa in questo posto, quanto costa comprare una casa in questo posto, prevedi approssimativamente quanto guadagni. Inoltre, utilizzando i tuoi social network, puoi capire quanto viaggi, dove ti trovi e quanto sei fedele al tuo datore di lavoro.

Di conseguenza, da un numero così elevato di parametri possiamo fare tutto ciò che vogliamo. Possiamo presentarti un prodotto che ti interessa. Riuscite ad immaginare un negozio online? Vai lì: questo negozio online cattura il tuo account su un social network e ti dice: "Masha, hai appena rotto con il tuo ragazzo, ecco alcuni prodotti per te". Questo non è il futuro prossimo...

Come viene determinata la geolocalizzazione di una persona?

Risposte alle domande del pubblico:

  • In genere, l'80% di tutti i check-in sono considerati presso il luogo esatto di residenza. Ma per le persone che non effettuano il check-in da nessuna parte, ci sono diverse opzioni: check-in o geolocalizzazione, oppure questa è un'analisi dei post e delle pubblicazioni per l'intero periodo di tempo in cui una persona ha scritto qualcosa... E da qualche parte, apparirà qualcosa come "Voglio comprare un passeggino vicino all'Akademicheskaya" o "Recentemente ho visto dei brutti graffiti sul muro qui". Cioè, per quasi l'80% delle persone, la geolocalizzazione, il luogo di lavoro e il luogo di residenza possono essere determinati utilizzando dati o metadati che possono essere raccolti dai social network.

    Questa, ancora una volta, è un'analisi dei post. Nel senso più semplice, si tratta di un'analisi dei check-in e della geolocalizzazione nei social network, che non cancellano i metadati jpeg (da questo puoi capire qualcosa). Ma per il resto delle persone, queste sono solitamente trasmissioni di testo: o una persona “brilla” la sua posizione quando scrive di qualcosa, oppure “brilla” il suo telefono, grazie al quale puoi trovare parte della sua pubblicità su Avito o il suo account su " Auto RU". Sulla base di questi dati, puoi combinare (ad esempio, "Sto vendendo un'auto vicino a Mayakovskaya") e presumerlo approssimativamente.

  • Le persone di solito lo pubblicano sui social media. Lavoriamo solo con fonti aperte e qui parliamo esclusivamente di fonti aperte. Di solito pubblicano annunci pubblicitari, cioè nel sessanta per cento dei casi la storia più comune quando le persone "mostrano" il loro attuale numero di cellulare sono annunci per la vendita di qualcosa. O in alcuni gruppi una persona scrive ("Vendo questo o quello lì"), oppure va da qualche parte.

    SÌ! Di solito commentano così: “Rispondimi o mandami un SMS, chiama il mio numero. Questo capita molto spesso a chi vende qualcosa, compra qualcosa sui social network, comunica con qualcuno... Così utilizzando questo numero potrete poi collegare ad esso il suo profilo su CIAN, se ha mai pubblicato qualcosa, o, ancora, su Avito. Queste sono semplicemente le fonti più popolari e principali, ne parleremo più avanti: queste sono Avito, CIAN e così via.

  • Questo si riferisce a un negozio online. Poi ci sarà la tecnologia del riconoscimento facciale e della corrispondenza dei profili (ne parleremo). In teoria, questo può essere applicato a un negozio offline. E in generale, il mio grande sogno è che quando compaiono gli striscioni stradali, quando passi davanti a una telecamera, "intrappoli" il tuo viso. Ma questo caso sarà vietato dalla legge perché costituisce una violazione della privacy. Spero che accada prima o poi.
  • Per esperienza personale. Molto spesso, quando una persona ti scrive qualcosa, tu agisci su alcuni fatti della sua vita che non dovresti sapere... Le persone nella maggior parte dei casi si spaventano. Ma! Secondo recenti statistiche, il numero di account chiusi sui social network è diminuito del 14%. Il numero dei falsi è in aumento, il numero dei conti aperti è in aumento: le persone si muovono sempre più verso l'apertura. Penso che tra 3-4 anni smetteranno di reagire in modo così forte al fatto che qualcuno conosca informazioni su di loro che potenzialmente non dovrebbero sapere. Ma in realtà è molto facile capirlo guardando il suo muro.

Cosa si può prendere dalle fonti aperte?

Esiste un elenco approssimativo di cose che possono essere comprese con un'affidabilità sufficientemente elevata da fonti aperte. In effetti, esistono parametri ancora più diversi; dipende dal cliente di tale ricerca. C'è qualche agenzia di risorse umane che è interessata a sapere se giuri sui social network o da qualche parte nello spazio pubblico. Qualcuno è interessato a sapere se ti piacciono le pubblicazioni di Navalny o, al contrario, le pubblicazioni di Russia Unita o qualche tipo di contenuto pornografico: cose del genere accadono abbastanza spesso.

I principali sono i valori della famiglia, il costo approssimativo di un appartamento, di una casa, la ricerca di un'auto e così via. Sulla base di ciò, le persone possono essere divise in gruppi sociali. Questi sono gli utenti di Tinder di Mosca, chi sono (secondo le foto trovate sui loro account Facebook); in base ai loro interessi, sono divisi in vari gruppi sociali:

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Se ci avviciniamo alla pubblicità, ci stiamo lentamente allontanando dal targeting pubblicitario standard, quando selezioni su VKontakte che sei interessato a uomini di 18 anni iscritti a determinati gruppi. La prossima volta ho questa foto, te la mostro adesso:

Arthur Khachuyan: “I veri Big Data nella pubblicità”

La conclusione è che la maggior parte dei servizi attuali che analizzano, in linea di principio, le persone che analizzano i social network, sono impegnati nell'analisi degli interessi... La prima cosa che viene in mente alle persone è analizzare i gruppi principali dei loro abbonati. Forse questo funziona per alcuni, ma personalmente penso che sia fondamentalmente sbagliato. Perché?

I tuoi Mi piace vengono raccolti e analizzati

Ora prendi i tuoi telefoni, guarda i tuoi gruppi principali: ci sarà sicuramente più del 50% dei gruppi di cui ti sei già dimenticato, questo è un tipo di contenuto che in realtà è irrilevante per te. Non lo consumi affatto, ma nonostante ciò il sistema ti traccerà in base a loro: che sei iscritto a ricette, ad alcuni gruppi popolari. Cioè, violerai il sistema che analizza il tuo profilo e i tuoi interessi non saranno giustificati.

Andiamo avanti... Cosa c'è? Assumiamo ciò che fanno gli altri. A nostro avviso, il modo più adeguato per valutare gli interessi degli utenti sono i Mi piace. Ad esempio, su VKontakte non c'è il feed dei Mi piace e le persone pensano che nessuno sappia cosa gli piace. Sì, alcuni Mi piace vengono introdotti su Instagram, vediamo qualcosa su Facebook, ma la maggior parte dei contenuti in alcuni gruppi non li trasmette in un feed comune e le persone vivono e pensano che nessuno saprà cosa gli piace.

E raccogliendo determinati contenuti di qualche tipo che ci interessano, raccogliendo questi post, raccogliendo questi Mi piace, quindi controllando questa persona utilizzando questo database, possiamo determinare con elevata precisione chi è, qual è il suo destino, cosa gli interessa. Posizionalo esattamente in un determinato gruppo sociale e interagisci con lui.

L’acquisto di un’auto cambia il comportamento

Ho un esempio del genere. Faccio subito una riserva sul fatto che i miei esempi sono quasi pubblicitari e quasi marketing, perché, sai, la maggior parte dei casi sono protetti da NDA e così via. Ma ci saranno ancora molte cose interessanti. Quindi, la storia con queste persone: sono uomini che hanno acquistato un'auto tra il 2010 e il 2015. Il modo in cui è cambiato il loro comportamento sociale online è indicato dal colore. La percentuale di ragazze tra gli iscritti è cambiata, mi sono iscritto a pagine pubbliche “maschili”, ho trovato un partner sessuale permanente...

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Il tutto è suddiviso per marca di auto e numero di persone. Da qui puoi trarre molte conclusioni interessanti sul comportamento delle persone e su come funziona. Posso dire che la Porsche Cayenne e la Priora piantata sono quasi identiche in termini di numero di pubblico attratto. La qualità di questo pubblico e il suo comportamento sono diversi, ma la quantità è più o meno la stessa. La conclusione che puoi trarre da qui è quella che desideri, più vicina al tuo mercato. Se vendi un’Audi, fai lo slogan “Compra un’Audi e allontanati dai tuoi genitori!” e così via.

Sì, questo è un esempio divertente del fatto che il comportamento delle persone in base all'analisi dei Mi piace, in base al gruppo in cui si spostano, a quali contenuti analizzano - con quasi il 100% di probabilità rende chiaro chi sei. Perché se non hai accesso al traffico di rete e non leggi i messaggi personali, i Mi piace ti diranno sempre chi è questa persona: una donna incinta, una madre, un militare, un poliziotto. E per te, come persona che può fare pubblicità, questo è un grande successo.

Risposte alle domande del pubblico:

  • Ogni colonna rappresenta il numero di persone a bordo di questa macchina; come sono cambiati i loro modelli di comportamento. Guarda: persone che hanno acquistato una Porsche Cayenne - circa 550 persone (giallo), la percentuale di ragazze tra gli abbonati è aumentata.
  • Il campione comprende gli utenti dei social network “Vkontakte”, “Facebook”, “Instagram” dal 2010 al 2015. Unica precisazione: le auto qui selezionate sono quelle che possono essere identificate nelle fotografie con una precisione superiore all'80% utilizzando determinati strumenti.
  • Per un certo periodo di tempo, la sua macchina (beh, non sua, lo lasciamo ai social network)... Per un certo periodo di tempo, una persona è stata costantemente fotografata con l'auto, era con essa, le pubblicazioni erano diverse, le fotografie erano da angolazioni diverse e così via. Successivamente verrà visualizzata una foto di quali persone scattano foto con quali auto e... Sì, questa è la seconda domanda: fiducia nei dati dei social network.
  • Da quando ne abbiamo parlato, purtroppo, i dati dei social media non sono sempre corretti. Le persone non sono sempre propense a pubblicare le proprie informazioni. Personalmente, ho condotto uno studio del genere: ho confrontato il numero di laureati delle università di Mosca con il numero di persone registrate sui social network. In media, sui social network sono registrate il 60% di persone in più - laureati dell'Università statale di Mosca in alcune specialità in un determinato anno - rispetto a quanto effettivamente ce ne sono in linea di principio. Quindi sì, qui c'è, naturalmente, una percentuale di errori e nessuno lo nasconde. Qui prendiamo semplicemente come base quelle auto che possono essere identificate con una probabilità superiore all'80%.

Elenco di fonti per l'addestramento del modello

Ecco un esempio di elenco di fonti utilizzabili, che serve per determinare con grande certezza il profilo sociale di una persona, chi è.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Prendiamo un profilo dai social network, da CIAN - il costo di un appartamento è di circa "Head-Hunter", "Superjob" - questo è lo stipendio medio per una determinata persona. Spero che non ci siano rappresentanti di Head Hunter qui, perché pensano che non sia molto positivo prendere questi dati da loro. Tuttavia, questo è lo stipendio medio in alcune regioni per determinati tipi di attività per posti vacanti.

"Avito", "Avto.ru": molto spesso le persone, quando il loro telefono è acceso, hanno sicuramente (in un gran numero di casi) almeno qualcosa su "Avito", o su "Avto.ru", o dall'altro diversi siti dai quali potrete capire chi sono. Se su questo numero di telefono venisse venduto un passeggino o un'auto... Rosstat e il Registro delle persone giuridiche dello Stato unificato sono ancora altri registri con l'aiuto dei quali è possibile classificare l'azienda datrice di lavoro - secondo una formula, secondo un modello che qualsiasi persona può impostare (puoi determinare approssimativamente il denaro di questa persona, ecc.).

Tinder aiuta a raccogliere dati sulla situazione delle persone

Inoltre, c'è una cosa così interessante (in alternativa, è molto divertente nello studio): si tratta, ancora una volta, della raccolta di dati da Mosca Tinder utilizzando i bot per questo Tinder. È stata determinata la distanza dalle persone e quindi è stata determinata la loro posizione approssimativa.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

L'obiettivo di questo studio era determinare il numero di conti Tinder sul territorio delle istituzioni governative: alla Duma, alla procura e così via. Ma tu, come inserzionista, puoi immaginare quello che vuoi: potrebbe essere, ad esempio, Starbucks o qualcun altro... Cioè, il numero di persone su Tinder che bevono il caffè da te, ordinano qualcosa, sono nei negozi Per quanto riguarda questa geolocalizzazione: questa può essere fatta con qualsiasi servizio.

Risposta ad una domanda del pubblico:

  • Tinder? Non lo sai? Tinder è un'app di appuntamenti in cui guardi le foto (sinistra-destra) e questa app ti mostra la distanza dalla persona. Se ottieni la distanza da questa persona da tre punti diversi, puoi determinare approssimativamente (+ 5-7 metri) la posizione. In questo caso, per la determinazione sul territorio della procura o della Duma di Stato, non è così difficile. Ma ancora una volta, potrebbe essere il tuo negozio, potrebbe essere qualsiasi cosa.

Ad esempio, molto, molto tempo fa abbiamo avuto un caso del genere (non uno studio), quando abbiamo ricevuto da uno degli operatori cellulari dati sulla densità del traffico, dati sulla densità di movimento dei punti cellulari e tutte queste informazioni sono state sovrapposte sulle coordinate dei cartelloni pubblicitari posizionati sulle autostrade. E il compito dell'operatore cellulare è determinare approssimativamente quante persone stanno passando e potrebbero potenzialmente vedere questo cartellone pubblicitario.

Se qui ci sono degli specialisti della cartellonistica, si può dire: è impossibile capire con la massima affidabilità: qualcuno sta arrivando, qualcuno non ha guardato, qualcuno ha guardato... Tuttavia questo è un esempio di come ci siano 20 miliardi di poligoni di questi a Mosca, su quale è la densità di queste persone ad ogni ora lungo determinati percorsi... Puoi vedere cosa passavano queste persone in ogni momento e stimare approssimativamente il flusso di passeggeri.

Risposta ad una domanda del pubblico:

  • Nessuno fornisce tali dati. Abbiamo condotto uno studio del genere per uno degli operatori; questa è una storia esclusivamente interna, quindi purtroppo non è presentata sotto forma di immagini. Ma spesso le grandi agenzie pubblicitarie non hanno problemi a contattare un operatore. Almeno a Mosca, ci sono molti precedenti in cui, ad esempio, le compagnie di assicurazione si rivolgono a compagnie come GetTaxi, che forniscono dati impersonali sull'età del conducente, come guida (buono - cattivo, spericolato - no), per prevedere politiche e così via. Tutti lottano con questo, ma a un certo livello interno, fornendo dati anonimi, penso che nessuno abbia questo problema.

Riconoscimento di immagini e modelli

Andare avanti. Il mio preferito è il riconoscimento delle immagini. Ci sarà un piccolo pezzo sulla ricerca delle persone in base ai volti, ma per lo più non prendiamo questa parte. Prendiamo in particolare il riconoscimento dell'immagine e determiniamo cosa c'è in questa immagine: la marca dell'auto, il suo colore e così via.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Ho questo esempio divertente:

Arthur Khachuyan: “I veri Big Data nella pubblicità”

C'è stato uno studio del genere sulla ricerca di tatuaggi su vari social network. Di conseguenza, lo stesso può essere applicato a qualsiasi marca, a qualsiasi immagine visiva, a quasi qualsiasi immagine visiva. Ci sono quelli che non possono essere determinati in modo affidabile (non li prendiamo).

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Ecco il mio preferito. I marchi automobilistici si rivolgono molto spesso a questo compito perché il loro compito, ad esempio, è trovare tutti i proprietari di una certa BMW X6, capire chi sono, come sono collegati tra loro, a cosa sono interessati e così via. Ciò si riferisce alla domanda su quali auto le persone scattano foto sui social network.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Qui non c'era alcun filtro: l'oggetto era loro, l'auto non era loro; È solo il guasto delle auto, l’età e così via. Ma il riconoscimento visivo delle immagini viene utilizzato abbastanza spesso: questa è la ricerca di donne incinte e la ricerca di loghi di marchi in una sorta di mass media (chi pubblica cosa).

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Il mio caso preferito (utilizzato da vari ristoranti): che tipo di panini vengono pubblicati su un social network. È una cosa divertente, ma in realtà ti permette di capire molte cose interessanti, in primo luogo, sui tuoi stessi clienti: chi è venuto da te e perché lo ha fatto. Perché non è un segreto che nei sushi bar la maggior parte delle persone (non dico "ragazze") scatta foto per fare il check-in, scattare una foto di qualcosa, ecc.

Il marchio può trarne vantaggio. Il marchio è interessato al tipo di prodotti di cui ha bisogno per fotografare e pubblicare magnificamente, che tipo di persone sono arrivate lì. Questa cosa può essere fatta con quasi tutto, dal cibo.

Riconoscimento di modelli video

Risposta ad una domanda del pubblico:

  • Non in video. Lo abbiamo in modalità test. Abbiamo provato questa tecnologia, ma si scopre che... Riconosce abbastanza bene tutto ciò che contiene video, ma non abbiamo trovato un'applicazione da nessuna parte. Ciao. A parte analizzare quanto e di quali video blogger si parla da qualche parte... C'è stato uno studio del genere. Quanti dei loro volti si incontrano, quanto spesso. Ma i marchi non hanno ancora capito dove inventarlo. Forse un giorno arriverà.

Ancora una volta, questo è cibo, possono essere donne incinte, uomini (non incinti), automobili - qualsiasi cosa.

Come opzione c’era uno studio di Capodanno per un media. Anche lontano dalla pubblicità, ma comunque. Questo è il tipo di cibo che le persone hanno digiunato per il nuovo anno:

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Anche qui è suddiviso per età. Si può vedere una tale correlazione che i giovani ordinano per lo più il cibo, gli adulti per lo più preparano una tavola tradizionale. È una cosa divertente, ma immaginandolo come proprietario di un marchio, puoi valutare un gran numero di cose: chi gestisce il tuo prodotto e come, cosa scrive a riguardo. Spesso le persone non menzionano sempre il marchio stesso nel testo e i tradizionali sistemi di monitoraggio analitico non sempre riescono a comprendere e trovare questa menzione del marchio solo perché non è menzionato nel testo. Oppure il testo è scritto male, non ci sono tag hash o altro.

Le foto sono visibili. Con la fotografia, puoi capire se si tratta del soggetto centrale dell'inquadratura o meno. Quindi puoi vedere cosa ha scritto questa persona. Ma molto spesso viene utilizzato come ricerca di potenziale pubblico che ha guidato determinate auto e così via. E poi faremo molte cose interessanti con queste auto.

Ai robot viene insegnato a imitare gli umani

C'era anche una tale opzione per utilizzare il conteggio delle persone:

Arthur Khachuyan: “I veri Big Data nella pubblicità”

C'è un'opzione per confrontare le persone, quando hai bisogno di trovare persone usando alcune fotografie, capire il loro profilo social, chi sono. Ancora una volta, torniamo alla domanda che se abbiamo una fotocamera in un negozio offline, allora questo è un modo abbastanza buono per capire chi viene da te, chi sono queste persone, cosa sono interessate, cosa le ha spinte a venire da te .

Poi arriva la cosa più interessante: se raccogliamo i loro account sui social network, capiamo chi sono queste persone, a cosa sono interessati, possiamo (come opzione) creare un bot simile a queste persone; questo bot inizierà a vivere come queste persone e analizzerà le pubblicità che vede sui vari social network. Ciò ti consentirà di capire con precisione quali marchi sono rivolti a questa persona. Questa è anche una storia abbastanza comune quando è necessario non solo analizzare chi è questa persona e quali interessi ha, ma anche quale tipo di pubblicità dovrebbero prendere di mira i tuoi potenziali concorrenti o altre persone interessate.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Analisi delle connessioni nei social network

Arthur Khachuyan: “I veri Big Data nella pubblicità”

La prossima cosa interessante è l'analisi delle relazioni tra le persone. In realtà, l'analisi delle connessioni nella rete, questi grafici di rete, non c'è niente di nuovo in questo, lo sanno tutti.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Ma l'applicazione ai compiti pubblicitari è la più interessante. Questa è una ricerca di persone che fanno tendenza, questa è una ricerca di persone che diffondono informazioni secondo determinati criteri all'interno di questa rete. Diciamo che siamo interessati agli stessi proprietari di un determinato modello BMW. Riunendoli tutti insieme, possiamo trovare chi controlla l’opinione pubblica. Questi non sono necessariamente blogger automobilistici e così via. Di solito si tratta di semplici compagni che siedono in varie pagine pubbliche, sono interessati ad alcuni contenuti e possono, in un brevissimo periodo di tempo, attirare il tuo marchio o qualcuno di tuo interesse in quest'area di responsabilità, nell'area di ​interesse.

C'è un esempio del genere qui. Abbiamo alcune persone potenziali, connessioni tra le persone. Qui quelli arancioni sono le persone, i puntini sono i gruppi comuni, gli amici comuni.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Se raccogli tutte queste connessioni tra loro, puoi vedere molto chiaramente che ci sono persone che hanno un gran numero di gruppi comuni, amici comuni, sono lì tra loro... E se questa stessa visualizzazione è divisa in gruppi per interessi, per contenuto, che distribuiscono, quanto interagiscono tra loro... Qui puoi vedere che l'immagine precedente è diventata così:

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Qui i gruppi sono chiaramente distinti per colore. In questo caso, questi sono gli studenti del nostro master presso la Higher School of Economics. Qui potete vedere che quelli viola/blu sono coloro che amano Transparency International, Open Russia e le pagine pubbliche di Khodorkovsky. In basso a sinistra ci sono i verdi, quelli che amano Russia Unita.

Puoi vedere che l'immagine precedente era così (queste sono solo connessioni tra persone), ma è diventata chiaramente delimitata. Cioè, tutte le persone sono sempre connesse tra loro, hanno gli stessi interessi, sono amiche tra loro. Ce ne sono alcuni in alto, altri in basso e altri compagni là. E se ciascuno di questi piccoli sottografi viene visualizzato separatamente con altri parametri e considera la velocità di diffusione dei contenuti (in parole povere, chi ripubblica cosa lì), puoi trovare in ogni parte una o due persone che hanno sempre in mano l'opinione pubblica, interagendo con il quale, chiedendo di inviare qualche tipo di post o qualcos'altro, puoi ottenere una risposta da tutto questo pubblico interessante.

Ho un altro esempio simile. Anche un grafico: questi sono i dipendenti del Gruppo BBDO trovati sui social network come esempio. Sembra poco interessante, grande, verde, le connessioni tra loro...

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Ma ho un'opzione in cui i gruppi sono già creati tra di loro. Poi, se qualcuno è interessato, c'è una versione interattiva: puoi cliccare e dare un'occhiata.

In alto a destra ci sono quelli che amano Putin. Qui i viola sono gli stilisti; coloro che sono interessati al design, a qualcosa di interessante e così via. Qui i bianchi sono i dirigenti (a quanto pare, da quanto ho capito); Si tratta di persone che, in generale, non sono collegate in alcun modo, ma lavorano approssimativamente nelle stesse posizioni. Il resto sono i gruppi comuni, le connessioni e così via.

I brand non hanno bisogno dei blogger, ma degli opinion leader

Prendiamo queste persone e le troviamo - poi l'agenzia pubblicitaria, la società pubblicitaria decide da sola: può dare soldi a questa persona in modo che interagisca in qualche modo con questo contenuto, qualcos'altro o indirizzare loro la propria campagna pubblicitaria specifica. Anche questo viene utilizzato abbastanza spesso, soprattutto adesso, perché tutti i marchi vogliono lavorare con i blogger, vogliono che i loro contenuti vengano promossi, ma le agenzie pubblicitarie non vogliono davvero contattare (beh, questo succede).

E la vera via d'uscita da questa situazione è trovare persone che non siano blogger, non beauty blogger, ma ad esempio alcuni esseri reali che interagiscono con questo marchio, che possano scrivere in qualche miserabile pagina pubblica "Mail.ru Answers", ottenere un certo numero di visualizzazioni. Queste persone, che sono costantemente interessate ai contenuti di questa persona, diffonderanno il tutto e il marchio sarà coinvolto.

La seconda opzione per utilizzare tale tecnologia ora è abbastanza rilevante: cercare i robot, la mia preferita. Questo è un rischio reputazionale per i tuoi concorrenti e un'opportunità per eliminare persone irrilevanti da una campagna pubblicitaria e qualsiasi altra cosa (eliminando commenti e cercando connessioni tra persone). Ho un esempio del genere, è anche grande e interattivo: puoi spostarlo. Questi sono collegamenti di persone che hanno scritto commenti nella comunità di Lentach.

Questo esempio serve per farti capire quanto siano buoni e facilmente visibili i bot; e per questo non è necessario avere alcuna conoscenza tecnica. Ciò significa che "Lentach" ha pubblicato un post sull'inchiesta della FBK su Dmitry Medvedev, e alcune persone hanno iniziato a scrivere commenti. Abbiamo raccolto tutte le persone che hanno scritto commenti: queste persone sono verdi. Ora lo sposterò:

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Le persone sono quelle verdi (che hanno scritto i commenti). Sono qui, sono qui. I punti blu tra loro rappresentano i gruppi comuni, i punti gialli sono gli abbonati, gli amici comuni e così via. La maggior parte delle persone sono connesse tra loro. Perché, qualunque sia la teoria delle tre, quattro, cinque strette di mano, tutte le persone sono connesse tra loro sui social network. Non esistono persone separate le une dalle altre. Anche i miei amici socialmente fobici che usano VKontakte esclusivamente per guardare video sono ancora iscritti ad alcune delle nostre stesse pagine pubbliche.

Anche Navalny usa i bot. Tutti hanno dei bot

La maggior parte delle persone (eccolo, qui) sono connesse tra loro. Ma c'è un gruppo così piccolo di compagni che sono amici esclusivamente tra loro. Eccoli, i piccoli verdi, ecco i loro amici e gruppi comuni. Qui sono addirittura caduti separatamente:

Arthur Khachuyan: “I veri Big Data nella pubblicità”

E per una fortunata coincidenza, sono state proprio queste persone a scrivere sotto questo post: "Navalny non ha prove" e così via, hanno scritto gli stessi commenti. Naturalmente non oso trarre conclusioni. Tuttavia, ho avuto un altro post su Facebook, quando c'è stato un dibattito tra Lebedev e Navalny, ho analizzato i commenti allo stesso modo: è risultato che tutte le persone che hanno scritto "Lebedev è una merda", non erano state sui social reti di recente quattro mesi, non iscritte a nessuna delle pagine pubbliche, improvvisamente sono andate su questo particolare post, hanno scritto questo commento esatto e se ne sono andate. Ancora una volta, è impossibile trarre conclusioni da qui, ma qualcuno del team di Navalny mi ha scritto un commento dicendo che non usano bot. Allora ok!

Più vicino alla pubblicità, più vicino al marchio. Tutti hanno i robot adesso! Noi li abbiamo, i nostri concorrenti li hanno e altri li hanno. Bisogna cacciarli o lasciarli vivere bene; Sulla base di tali dati (indica la diapositiva precedente), portali alla perfezione in modo che assomiglino a persone reali e solo dopo usali. Anche se usare i bot è dannoso! Tuttavia, una storia abbastanza comune...

In modalità automatica, una cosa del genere ti consente di filtrare dalla tua analisi le persone che sono irrilevanti per l'analisi, le persone che non dovrebbero essere incluse nel campione, non dovrebbero essere incluse in questo studio. Usato molto spesso. Inoltre, non tutti i proprietari di automobili possiedono effettivamente un’auto. A volte le persone sono interessate solo alle persone che potenzialmente hanno un'auto, che si siedono in alcuni gruppi, comunicano con qualcuno, hanno un certo pubblico lì.

Analisi di fatti e opinioni

Anche il prossimo che ho è il mio preferito. Questa è un'analisi di fatti e opinioni.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Al giorno d'oggi tutti sanno menzionare il proprio marchio in varie fonti. Non c'è nessun segreto in questo. E tutti sembrano essere in grado di calcolare la tonalità... Anche se personalmente, penso che la metrica della tonalità in sé non sia molto interessante, perché quando vieni a dire al cliente: "Amico, hai il 37% neutro", e lui lo dice , " Oh! Freddo!" Sarebbe quindi più interessante spingersi un po’ oltre: dalla valutazione del sentiment alla valutazione delle opinioni su ciò che dicono del tuo prodotto.

E anche questa è una cosa molto interessante, perché... personalmente credo che in linea di principio non possano esserci messaggi neutri, perché se una persona scrive qualcosa nello spazio pubblico, questo messaggio viene in qualche modo colorato. Personalmente non ho mai visto un messaggio neutro che menzionasse un marchio. Di solito è una specie di sporco.

Se prendiamo un gran numero di questi messaggi (potrebbero essere milioni, 10 milioni), evidenziamo l'idea principale di ciascun messaggio, li combiniamo, possiamo capire in modo abbastanza affidabile cosa dicono le persone di questo marchio, cosa pensano. “Non mi piace la confezione”, “Non mi piace la consistenza” e così via.

Cosa pensa la gente di Transaero, Chupa Chups e del Presidente degli Stati Uniti?

Faccio un esempio divertente: questa è un'infografica su cosa farebbero gli utenti dei social network con la società Transaero dopo il suo fallimento.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Ci sono molti esempi interessanti: bruciare, uccidere, deportare in Europa, c’è stato addirittura il 2% che ha scritto: “Mandateli in Siria per operazioni militari”. Passando dalla cosa divertente, potrebbe trattarsi di quasi qualsiasi marca, dal mio cibo per cani preferito ad alcune automobili. A chi non piace il packaging, a chi non piacciono le cose vere, puoi sempre lavorarci, puoi sempre tenerne conto. Esistono numerosi esempi in cui le persone hanno quasi cambiato la produzione dei loro prodotti perché hanno scritto sui social network che Chupa Chups non era abbastanza rotondo o non era abbastanza dolce.

C'è un altro esempio divertente. Indovina quali commenti e su chi?

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Per qualche motivo, ormai l'analisi delle opinioni, l'analisi dei fatti estratti dai messaggi, è poco utilizzata e poco diffusa. Sebbene questa tecnologia non sia super segreta, non c’è praticamente alcun know-how in merito, perché dai commenti delle persone, estrarre il soggetto, il predicato e raggrupparli non richiede un genio nella linguistica computazionale. Non è così difficile da fare. Ma spero che nei prossimi due anni le persone inizieranno a usarlo, perché... Sarà fantastico: è un feedback così automatico! Sai sempre cosa dicono di te. Bene, capisci che questo è stato fatto riguardo al presidente degli Stati Uniti.

Risposta ad una domanda del pubblico:

  • Sì, questo è Facebook in inglese. Sono tradotti in russo qui. Questo era scritto da qualche parte.

Big Data e tecnologie politiche

In effetti, ho molti diversi esempi interessanti di politica su Trump e su tutti gli altri, ma abbiamo deciso di non portarli qui. Ma c’è un esempio politico.

Queste sono le elezioni alla Duma di Stato. Quando eri? L'anno scorso? Quasi un anno e mezzo fa.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Ecco persone che sono riuscite a determinare la loro esatta posizione, fino a un certo geopunto, per capire in quale circoscrizione elettorale si trovano. E poi da queste persone sono stati presi solo quelli che hanno espresso la loro opinione definitiva, per la quale avrebbero votato.

Dal punto di vista della tecnologia politica, questo non è molto corretto, perché l'intera faccenda deve essere normalizzata dalla densità di popolazione e così via. Tuttavia qui i blu voteranno per chissà chi, i rossi voteranno per i compagni dell'opposizione, che tra l'altro non erano molti.

Personalmente ritengo che i Big Data non raggiungeranno presto le tecnologie politiche, ma, come opzione, il candidato è anche un brand. E questa è anche, in una certa misura, un'analisi di fatti e opinioni sul tuo brand, e una cosa piuttosto interessante, perché puoi capire in tempo reale chi sta facendo cosa. Conosco diversi casi della BBC, quando hanno monitorato i social network in tempo reale in alcune trasmissioni: c'è stata questa e quella risposta, la gente ne scrive, fa questa e quella domanda - ed è fantastico! Penso che verrà utilizzato molto presto, perché interessa a tutti.

Modellare le posizioni del marchio

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Successivamente ho la modellazione delle posizioni del marchio. Un piccolo, breve pezzo su come classificare i marchi utilizzando varie metriche (non i Mi piace degli abbonati sui social network, ma utilizzando metriche complesse, interesse per i contenuti, tempo trascorso a ricevere metriche).

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Ho un esempio di “farmaceutico” per un certo motivo. Qui i cerchi piccoli sono interni, luminosi: questa è la quantità di contenuto testuale creato dal marchio stesso, il cerchio grande è la quantità di contenuti fotografici e video creati dal marchio stesso.

La vicinanza al centro mostra quanto sia interessante il contenuto per il pubblico. C'è un grande modello, ci sono un sacco di parametri di ogni genere: Mi piace, repost, tempo di risposta, chi ha condiviso lì in media... Qui puoi vedere: c'è un meraviglioso "Kagotsel", che pompa un'enorme quantità di soldi per creare i propri contenuti e per questo sono abbastanza vicini al centro. E ci sono compagni che creano anche i propri contenuti, ma al pubblico non interessa. Questo non è un esempio molto adeguato, perché tutti questi resoconti sono praticamente morti.

Yegor Creed è amato più di Basta

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Purtroppo il resto... da cosa mostrare... Beh, ci sono anche rapper russi, come opzione, di compagnie vere.

Qual è il vantaggio? Il fatto è che un'azienda può investire quasi tutto in un modello del genere, a partire dallo stipendio medio degli abbonati che lavorano per il tuo marchio; qualsiasi modello preferiscano. Poiché ogni agenzia pubblicitaria calcola le proprie metriche in modo diverso, i marchi calcolano le proprie metriche in modo diverso.

Ce n'è anche uno qui: Basta, che genera una grande quantità di contenuti, ma si trova in periferia, perché apparentemente questi contenuti non sono molto interessanti per il pubblico. Ancora una volta, non ho la presunzione di giudicare. Tuttavia, c'è Yegor Creed, che, secondo i social network, è quasi il miglior interprete del nostro tempo, ma pubblica solo le sue fotografie personali. Tuttavia ha un gran numero di abbonati: ce ne sono circa un milione. Non ricordo il numero esatto; Ricordo che la percentuale di coinvolgimento di queste persone è molto superiore all'85%, ovvero per milione di iscritti riceve 850mila risposte da queste persone reali: questa è una vera follia. Questo è vero.

Arthur Khachuyan: “I veri Big Data nella pubblicità”

Risposte alle domande del pubblico:

Quanto tempo ci è voluto per creare il modello di analisi del rapper?

  • Ognuno ha il proprio target di riferimento, gli interessi di queste persone vengono calcolati per ciascuno... Tutto questo è normalizzato approssimativamente alla distanza dal centro, la loro posizione radiale non è importante (qui viene semplicemente imbrattata per bellezza, in modo che lo facciano non incontrarsi). Importante è solo la vicinanza approssimativa al centro. Questo è il modello che utilizziamo. Ad esempio, a me piace di più il cerchio, alcune persone lo immaginano come un semicerchio.
  • Questo modello è stato compilato rapidamente, in due o tre ore (sì, una persona). Qui sono state inserite solo metriche: cosa moltiplichiamo per cosa, lo sommiamo e poi in qualche modo lo normalizziamo. Dipende dal modello. Ci sono persone a cui interessa lo stipendio medio (non è uno scherzo) dei propri abbonati. E per questo devi trovare i loro contatti, Avito, calcolare tutto, moltiplicarlo. Succede che ci vuole molto tempo per tenerne conto, ma in particolare questo (indica la diapositiva precedente) - i parametri qui sono molto semplici: abbonati, ripubblicazioni e così via. Per completarlo ci sono volute circa due o tre ore. Di conseguenza, questa cosa viene quindi aggiornata in tempo reale e puoi usarla.

Ora arriva la parte divertente. Ho finito con gli esempi, perché non è interessante parlare a lungo da soli. E spero che ora farete domande, e in effetti passeremo da un argomento all'altro, perché ho questi esempi di come possono essere utilizzate le tecnologie e così via...

Risposte alle domande del pubblico:

  • Ho avuto un unico caso personale con uno, per così dire, "vicino al casinò", quando lì è stata posizionata una telecamera, i volti sono stati riconosciuti e così via. La percentuale di persone riconosciute è decisamente piuttosto elevata, sia nostra che dei nostri concorrenti. Ma in realtà è piuttosto interessante. Lo vedo come una cosa interessante: puoi capire chi sono queste persone e prevedere abbastanza bene perché esattamente sono venuti qui, cosa è cambiato così tanto nella loro vita che hanno deciso di venire al casinò. Ma per quanto riguarda tipi specifici di attività... Se metti una cosa del genere in una farmacia, non ha senso: non puoi prevedere perché una persona è venuta in farmacia.

    Il compito globale qui era quello di costruire un modello per capire quando una persona vuole potenzialmente essere interessata al tuo marchio, in modo che tu possa fargli pubblicità non dopo che ha comprato qualcosa (come sta accadendo ora), ma fargli pubblicità” in previsione” di quando tutto ciò accadrà. È stato interessante con un simile "vicino al casinò"; si è rivelata una percentuale piuttosto interessante di queste persone - perché: qualcuno ha ricevuto improvvisamente una promozione, qualcun altro ha ottenuto qualcos'altro - approfondimenti così interessanti. Ma con alcuni negozi, con la vendita al dettaglio, con un negozio di una sorta di pillole, mi sembra che non sarà molto corretto.

I Big Data vengono utilizzati offline?

  • Era offline. Devi solo capire esattamente, approssimativamente, se questo modello andrà bene oppure no. Ancora con l'acqua frizzante... in realtà mi interessa tutto, ma personalmente non capisco quanto, come i profili di queste persone, il loro comportamento possano dipendere da quando vogliono comprare l'acqua in bottiglia. Anche se questo potrebbe essere vero, non lo so.

Quanti account di social media aperti ci sono?

  • Abbiamo specificamente 11 social network: "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagram" e alcune piccole cose (posso guardare l'elenco, come "Mail.ru" e così via) . Su VKontakte abbiamo sicuramente una copia di tutti questi compagni. Abbiamo persone su VKontakte: 430 milioni di tutti coloro che sono mai esistiti (di cui circa 200 milioni sono costantemente attivi); ci sono gruppi, ci sono connessioni tra queste persone e ci sono contenuti che ci interessano (testo), e una parte dei media, ma molto piccola... In parole povere, guardiamo questa immagine: se ci sono dei volti lì, noi salviamoli, se c’è un meme, lo salviamo. Non lo salviamo, perché anche noi non ne avremmo abbastanza per salvare il contenuto multimediale.

    C'è un Facebook in lingua russa. Da qualche parte ora il 60-80% sono Odnoklassniki, tra un paio di mesi probabilmente li porteremo tutti alla fine. Instagram russo. Per tutti questi social network esistono gruppi, persone, connessioni tra loro e testo.

  • Circa 400 milioni di persone. C'è una sottigliezza: ci sono persone la cui città non è specificata (sono potenzialmente russe/non russe); Di questi, la media per i social network è del 14% di account chiusi su VKontakte, non conosco la cifra esatta su Facebook.
  • Inoltre, non salviamo i media su Instagram, solo se ci sono dei volti lì. Non memorizziamo tali (altri) contenuti multimediali. Di solito interessante: solo testo, connessioni tra persone; Tutto. La ricerca più comune su Instagram è la solita ricerca sul pubblico: chi sono queste persone e, soprattutto, la connessione di queste persone con altri social network. Trova il profilo di questa persona su Vkontakte e Facebook per calcolare la sua età e così via.
  • Non è ancora necessario affrontare tutti gli altri, semplicemente perché non ci sono clienti. Per quanto riguarda la lingua: abbiamo russo, inglese, spagnolo, ma questa viene utilizzata esclusivamente per i marchi russi; beh, o le aziende che li portano dalla Russia.
  • Intervistiamo persone ogni giorno in tanti, tanti, tanti thread: raccogliamo dati raccogliendo il web e aggiorniamo questi indicatori utilizzando Api. In 2-3 giorni puoi percorrere l'intero "VKontakte", esaminandoli; In circa una settimana puoi esplorare l'intero Facebook, capendo chi ha aggiornato cosa e cosa no. E poi riassemblare queste persone separatamente: cosa è cambiato esattamente, scrivi l'intera storia. Nella mia esperienza, molto raramente il vecchio profilo sui social media di qualcuno è stato utilizzato per scopi commerciali reali. Questo è stato il momento in cui una figura politica si è candidata, e il suo compito era capire che tipo di persone vengono in sede, chi erano queste persone 6-8 mesi fa (hanno cancellato il loro profilo, ma in realtà per un altro candidato sono arrivate le schede rovinare).

    E un paio di volte - storie personali in cui le fotografie di qualcuno sono state pubblicate di pubblico dominio. Era necessario trovare collegamenti, ecc. Purtroppo è un peccato, ma non possiamo testimoniare in tribunale, perché il nostro database è giuridicamente illiquido.

  • Lo spazio di archiviazione MongoDB è il mio preferito.

I social network stanno cercando di combattere la raccolta dei dati

  • Di solito carichiamo solo un elenco di questi account sugli inserzionisti e poi utilizzano quello standard... Cioè, sui social network, su VKontakte, puoi specificare un elenco di queste persone.

    Ma Facebook utilizza i cookie acquistati. Noi stessi non lavoriamo con i cookie, ma ci sono state diverse storie in cui l'inserzionista stesso ha dato ad alcune persone, abbiamo interagito con loro - hanno queste reti, con pubblicità teaser e non teaser, questi "cookie". Puoi allacciarlo, non c'è dubbio! Ma non mi piace davvero questa roba perché non penso che sia molto autentica. Questo è puramente secondo me, è come TNS, che "traccia" la TV - non è chiaro se stai guardando questa TV o no, se stai lavando i piatti mentre la TV è accesa... E qui è lo stesso : Molto spesso cerco qualcosa su Google su Internet, ma ciò non significa che voglio comprarlo.

  • Se utilizzi una sorta di rete pubblicitaria contestuale standard: ho avuto diverse storie quando abbiamo scaricato loro queste persone e abbiamo provato, utilizzando le loro interfacce, a collegarle ai "cookie" sui loro siti. Ma non mi piacciono davvero queste cose.

Formula per calcolare lo stipendio di un utente Internet

  • La formula generale per lo stipendio medio: questa è la regione in cui vive una persona, questa è la categoria di attività in cui lavora (cioè l'azienda che è il suo datore di lavoro), quindi viene presa la sua posizione in questa azienda, la media lo stipendio per questa posizione è stimato... Stipendio medio preso da "Head Hunter" e "Superjob" (e ci sono molte altre fonti) per un dato posto vacante in una data regione e per un dato contesto aziendale.

    Da "Avito" e "Avto.ru" vengono solitamente presi parametri aggiuntivi se una persona ha illuminato il telefono. Con Avito puoi vedere che tipo di cose vende una persona: costose, poco costose, usate, non usate. Con "Avto.ru" puoi vedere se ha un'auto: la possiede, non la possiede. Si tratta di meno del 20% delle persone che hanno accidentalmente lasciato cadere il telefono da qualche parte e il loro account può essere collegato a questi dati.

Quali volumi opera la società di raccolta dati?

  • Il volume delle fotografie archiviate in petabyte è 6,4. Non posso dire esattamente il tasso di crescita adesso, perché nel 2016 abbiamo iniziato a registrare “periscopi” e abbiamo appena iniziato a registrare video.

    Non posso dire esattamente quando era zero. Siamo passati da un'azienda all'altra: sono tutte storie lunghe. Ma posso dire che VK, Facebook, Instagram e Twitter - tutta questa attività (persone, gruppi e connessioni tra loro) con testo e contenuti - in realtà non si tratta di molti dati, è improbabile che anche un petabyte ne abbia abbastanza. Penso che siano 700 gigabyte, probabilmente 800.

Aiuti i clienti a determinare la nicchia attuale e dove scavare?

  • Quando arriva un cliente, gli suggeriamo queste cose, ma noi stessi, come Google Trends, non le facciamo.
  • Avevamo diverse storie quasi sociologiche, con storie elettorali e preelettorali: le abbiamo analizzate tutte. Con i marchi e la valutazione delle opinioni sui marchi, quasi sempre tutto concorda. Ecco le storie delle elezioni elettorali - no (con una valutazione di quale candidato dovrebbe vincere). Non so chi abbia torto qui: noi o coloro che pensano in VTsIOM.
  • Di solito prendiamo questi risultati del controllo dal marchio stesso, loro li prendono dai compagni che ordinano ricerche: ricerche telefoniche, ricerche di mercato e così via. Inoltre, tutto questo può essere controllato con cose basilari: qualcuno ha risposto alla mailing list, qualcuno ha fatto sondaggi... Se si tratta di un grande marchio (Coca-Cola, per esempio), ha sicuramente un milione o due recensioni interne da parte dei clienti – non si tratta solo di commenti sui social network e di alcune opinioni; Questi sono una sorta di sistemi interni, recensioni e così via.

La legge non “sa” cosa sono i dati personali!

  • Analizziamo esclusivamente fonti di dati aperte e non ci facciamo mai coinvolgere in trucchi sporchi. Il nostro modello si basa sul fatto che archiviamo tutti i dati aperti in alcuni data center pubblici, li affittiamo da qualche altra parte e li analizziamo a casa, nei nostri uffici, nei nostri server, e non vanno da nessuna parte fuori dal territorio.

    Ma la nostra legislazione in materia di dati aperti è molto vaga.

    Non abbiamo una comprensione chiara di cosa siano i dati aperti, cosa siano i dati personali: esiste questa 152a legge federale, ma comunque... Come contano? Ora, se ho il tuo nome e il tuo numero di telefono in un database, in un altro database ho il tuo numero di telefono e la tua e-mail, in un terzo ho, diciamo, la tua e-mail e la tua macchina; Tutto questo sembra essere dati non personali. Se mettiamo insieme tutto questo, sembra che secondo la legge diventeranno dati personali.

    Risolviamo questo problema in due modi. Il primo è installare un server con software per il cliente, quindi questi dati non vanno oltre il suo territorio, quindi il cliente è responsabile della distribuzione di questi dati personali, dati non personali e così via. Oppure la seconda opzione: se si tratta di una storia in cui devi denunciare un social network o qualcos'altro...

    Abbiamo condotto uno studio del genere quando abbiamo raccolto per Lifenews i resoconti di questi compagni (c'erano le primarie di Russia Unita) e abbiamo esaminato che tipo di porno piacevano loro. Era una cosa divertente, ma comunque. Lo vendiamo come la nostra opinione personale, senza rivelare legalmente nei documenti ciò che abbiamo analizzato: il Registro delle persone giuridiche dello Stato unificato, gli stipendi, i social network; Vendiamo opinioni di esperti e poi in disparte spieghiamo alla persona cosa abbiamo analizzato e come.
    Le storie erano diverse, ma erano legate ad alcuni progetti commerciali pubblici. Ad esempio, abbiamo un progetto gratuito senza scopo di lucro per coloro che vanno su longboard (tavole del genere sono lunghe): il compito era raccogliere le pubblicazioni delle persone - quando qualcuno pubblica "Sono andato a Gorky Park a fare un giro". E ora dovrebbe salire sulla mappa e le persone intorno a lui potranno vedere che qualcuno è vicino a lui. VK si è scontrato con noi su questo argomento per molto tempo, perché non gli piaceva il fatto che pubblicassimo queste informazioni senza il permesso delle persone. Ma poi la questione non è arrivata in tribunale, perché all'interno di diverse grandi comunità abbiamo aggiunto alle regole che i dati potrebbero essere utilizzati da terzi, agenzie, aziende, analisi, ecc. Naturalmente non era particolarmente etico, ma comunque.

  • Ce ne siamo resi conto in tempo e abbiamo iniziato a vendere a tutti la nostra opinione di esperti.

Collabori con istituti scolastici?

  • Collaboriamo con istituzioni educative, sì. Abbiamo tutta una serie di possibilità: abbiamo un master presso la Scuola Superiore e collaboriamo con altre università. Amiamo moltissimo le università!
  • Se hai i miei contatti puoi scrivermi. E un collegamento alla presentazione, se qualcuno è interessato, ci sono tutti questi esempi, puoi spostarlo.
  • Se conosci il numero di telefono, la posta: questa è un'opzione quasi al cento per cento, nessuno la rimuoverà. Se non c'è il numero di telefono, di solito è una foto; se non c'è nessuna foto, è l'anno, il luogo di residenza, il lavoro. Cioè, per anno, luogo di residenza e lavoro, quasi tutti possono sempre essere identificati in modo abbastanza sottile. Ma questa, ancora una volta, è una questione relativa al compito.

    Abbiamo, diciamo, un cliente che vende televisione su Internet. Qualcuno ha acquistato da loro un abbonamento a questi "Giochi di Troni" e il compito è utilizzare il proprio CRM per trovare queste persone sui social network e quindi trovare potenziali dalla loro area di influenza. Voglio dire solo che hanno, diciamo, nome, cognome ed e-mail... E poi è molto difficile fare qualsiasi cosa. Nella maggior parte dei casi, le persone possono essere trovate tramite e-mail.

  • In base alla composizione dei nostri amici, solitamente “abbiniamo” le persone sui social network, ma questo non è sempre corretto. Non è che non sia sempre giusto: non sempre funziona. In primo luogo, ciò richiede molto lavoro, perché questa operazione (abbinamento delle persone) dovrà essere eseguita prima per ciascuno degli amici, per capire se provengono dai social network o meno. E poi - un fatto sconosciuto a chiunque che su VKontakte abbiamo gli stessi amici, su Facebook abbiamo amici diversi. Non per tutti, ma per me, ad esempio, è così; e questo è vero anche per la maggior parte delle persone.

Come vengono raccolti i dati più completi?

  • Installazione del software per il cliente dalla sua parte. Su di loro è installato un server che preleva da noi solo dati pubblici ed elabora internamente i loro dati personali. Viene stipulata una NDA con il cliente. Questo, ovviamente, non è molto corretto che ce lo trasferiscano, ma la responsabilità legale spetta al cliente, beh, cioè installare software per lui o trasferire dati anonimi. Ma questo era molto raro, perché – anonimizzazione corretta o errata – nella maggior parte dei casi la dipendenza tra queste persone viene meno.

Chi acquista il software di riconoscimento facciale?

  • In realtà andiamo qui perché il nostro software principale che vendiamo è la ricerca facciale, l'analisi delle correlazioni e lo vendiamo alle agenzie governative. E un anno e mezzo fa, abbiamo deciso che avremmo inserito tutte queste storie nella pubblicità, nel marketing, nel mercato pubblico: è così che è nata Social Data Hub, un'entità legale commerciale. E ora stiamo proprio arrivando qui. Siamo qui da un anno e mezzo ormai, cercando di spiegare alla gente che non c'è bisogno di fornire download con una menzione, che bisogna dare risposte alle domande, che non c'è bisogno della tonalità , e così via. Quindi è difficile dire dove...
  • (Chi intendi?) A tutti i compagni che hanno bisogno di cercare terroristi e pedofili.
    Posso dire subito (questa sarà la prossima domanda): secondo i nostri dati, nessun insegnante è stato incarcerato per ripubblicazione.
  • Su VKontakte - 14%; su Facebook non esiste un profilo chiuso in quanto tale (esiste un elenco chiuso di amici e così via). E la cosa più interessante è che ho appena scritto un messaggio: ora conteranno e diranno.

Non pubblicare qualcosa di cui ti vergogneresti!

  • Non pubblicare nulla sui social network che possa farti vergognare: lo seguo personalmente. Anche se di personali ne avevo tanti, perché lo giuro su Facebook. Beh, c'era e c'era qualcosa da fare... Non pubblicare nulla che possa essere imbarazzante! Se più tardi lavorerai da qualche parte nella Camera pubblica, sì, è meglio non commentare. Se non lo farai, in generale, non importerà a nessuno. Posso solo assicurarti che nessuno legge la tua corrispondenza personale, e tutto questo contribuisce a costruire tutta questa storia...

    Ogni settimana qualcuno viene sicuramente da me e dice: “Beh, le foto del mio amico sono trapelate su una pagina pubblica anonima! Aiuto! A proposito, non pubblicare mai nulla su pagine pubbliche anonime.

  • Non conosco altri sistemi di monitoraggio, ne terremo sicuramente conto, che la menzione del marchio era negativa, Dio mi perdoni... Ma posso dire che tutti i tipi di compagni vicini allo stato sono interessati solo alle persone che hanno un pubblico di oltre 5mila persone e la loro opinione pubblica può influenzare qualcuno, quindi influenzare. Nella mia esperienza, non è mai successo che l’agenzia delle risorse umane che ci ordina le valutazioni dei profili dicesse: “Chi ama Navalny, non assuma nessuno!”

Sulla pubblicazione dei risultati. Quante persone sono impiegate nella ricerca?

  • Delle 10 principali società pubblicitarie, sette ora pubblicano. È difficile da dire: quando abbiamo iniziato un anno e mezzo fa... Abbiamo diverse persone in ogni area: ci sono diverse persone nelle banche, ci sono diverse persone nelle risorse umane, ci sono diverse persone nella pubblicità. E ora stiamo pensando a chi è più redditizio rivolgerci per primo, per il quale dobbiamo iniziare a realizzare alcune interfacce...
  • (circa il numero di persone per segmento di mercato) Non più di 25 persone, perché non abbiamo violentato nessuno.
  • In generale, in linea di principio, queste tecnologie del mercato vengono utilizzate, credo, da oltre il 50%. Alcuni nelle campagne pubblicitarie, altri in una sorta di analisi interna. Direi che il 40% lo utilizza nell'analisi interna, il 50-60% lo vende ai marchi finali. Ma questo dipende già dalle stesse società pubblicitarie. Vedete, alcuni riferiscono semplicemente per i soldi spesi, per la pubblicità che hanno fatto, mentre altri scrivono su quanta gente hanno portato, che tipo di pubblico... direi di sì, ma potrei sbagliarmi, non lo so. Non riesco davvero a immaginare come lavorano tutti questi compagni. Lo so solo in dati quantitativi.

Alcuni annunci 🙂

Grazie per stare con noi. Ti piacciono i nostri articoli? Vuoi vedere contenuti più interessanti? Sostienici effettuando un ordine o raccomandando agli amici, cloud VPS per sviluppatori da $ 4.99, un analogo unico dei server entry-level, che è stato inventato da noi per te: Tutta la verità su VPS (KVM) E5-2697 v3 (6 core) 10 GB DDR4 480 GB SSD 1 Gbps da $ 19 o come condividere un server? (disponibile con RAID1 e RAID10, fino a 24 core e fino a 40 GB DDR4).

Dell R730xd 2 volte più economico nel data center Equinix Tier IV ad Amsterdam? Solo qui 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV da $199 In Olanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - da $99! Leggi Come costruire Infrastructure Corp. classe con l'utilizzo di server Dell R730xd E5-2650 v4 del valore di 9000 euro per un centesimo?

Fonte: habr.com

Aggiungi un commento