Arthur Khachuyan: "Big Data real na publicidade"

O 14 de marzo de 2017, Arthur Khachuyan, CEO de Social Data Hub, falou na conferencia BBDO. Arthur falou sobre a vixilancia intelixente, a construción de modelos de comportamento, o recoñecemento de contidos fotográficos e de vídeo, así como outras ferramentas e investigacións do Social Data Hub que permiten dirixirse ao público mediante redes sociais e tecnoloxías de Big Data.

Arthur Khachuyan: "Big Data real na publicidade"

Arthur Khachuyan (en diante - AH): - Ola! Ola a todos! Chámome Arthur Khachuyan, dirixo a empresa Social Data Hub e dedicámonos a varias análises intelectuais interesantes de fontes de datos abertas, campos de información e facemos todo tipo de investigacións interesantes, etc.

E hoxe os compañeiros do Grupo BBDO pedíronnos falar de tecnoloxías modernas para analizar big data, big data e non tan big data para a publicidade: como se usa, mostra algúns exemplos interesantes. Espero que fagades preguntas polo camiño, porque podo aburrirme e non revelar a esencia, etc., así que non sexas tímido.

En realidade, as principais direccións, onde algunha vez se usaron algún tipo de solucións de "datos case grandes", están todas claras: esta é a orientación ao público, a análise, a realización de algún tipo de investigación de mercado analítica. Pero sempre é interesante que datos adicionais se poden atopar, que significados adicionais se poden atopar despois de aplicar a análise.

Por que necesitamos tecnoloxía para a publicidade?

Por onde comezamos? O máis obvio é a publicidade nas redes sociais. Hoxe quiteino pola mañá: por algún motivo VKontakte pensa que debería ver este anuncio en particular... Se é bo ou malo é a segunda pregunta. Vemos que definitivamente entro na categoría de reclutas:

Arthur Khachuyan: "Big Data real na publicidade"

O primeiro e máis interesante que se pode tomar como solución tecnolóxica... O primeiro que quería decidir antes de comezar é definir os termos: que son os datos abertos e que son os big data? Porque todas as persoas teñen o seu propio entendemento neste asunto, e eu non quero impoñer as miñas condicións a ninguén, pero... Só para que non haxa discrepancias.

Persoalmente, creo que os datos abertos son todo o que podo chegar sen ningún usuario ou contrasinal. Este é un perfil aberto nas redes sociais, isto son resultados de busca, son rexistros abertos, etc. Big data, ao meu entender, véxoo así: se é unha placa de datos, son mil millóns de filas, se é algún tipo. de almacenamento de ficheiros, é nalgún lugar un petabyte de datos. O resto da miña terminoloxía non é big data, senón algo así.

Perfil de alta precisión e puntuación de perfil

Imos en orde. O primeiro e máis interesante que se pode obter ao analizar fontes de datos abertas é a creación de perfís de alta precisión e a puntuación do perfil. Que é isto? Esta é unha historia na que a túa conta de rede social pode predecir non só quen es, non só os teus intereses.

Pero agora, combinando varias fontes, podes comprender o nivel medio do teu salario, canto custa o teu apartamento e onde se atopa. E todos estes datos pódense usar literalmente desde os medios dispoñibles. Por exemplo, se levas a túa conta nunha rede social, mira, digamos, onde vives, onde traballas; comprender en que sección do negocio está a empresa na que traballas; descargar prazas similares de HH e “Superjob” se es analista, xestor, etc.; mira onde vives (base, digamos CIAN), comprenda canto custa alugar unha casa neste lugar, canto custa mercar unha vivenda neste lugar, prede aproximadamente canto gañas. Ademais, usando as túas redes sociais, podes comprender canto viaxas, onde estás e o fiel que é co teu empregador.

En consecuencia, a partir dunha cantidade tan grande de métricas podemos facer todo o que queiramos. Podemos presentarche un produto que che interese. Imaxinas unha tenda en liña? Vai alí: esta tenda en liña colle a túa conta nunha rede social e diche: "Masha, acabas de romper co teu mozo, aquí tes algúns produtos para ti". Este non é o futuro próximo...

Como se determina a xeolocalización dunha persoa?

Respostas ás preguntas do público:

  • Normalmente, o 80% de todos os check-in considéranse como o lugar exacto de residencia. Pero para as persoas que non se rexistran en ningún sitio, hai varias opcións: ou facturar, ou xeolocalización, ou esta é unha análise de publicacións e publicacións durante todo o período de tempo no que unha persoa escribiu algo... E nalgún lugar, aparecerá algo como "Quero mercar un carriño preto de Akademicheskaya" ou "Recentemente vin pintadas feas na parede aquí". É dicir, para case o 80% das persoas, a súa xeolocalización, o seu lugar de traballo e o seu lugar de residencia pódense determinar mediante datos ou metadatos que se poden recoller das redes sociais.

    Esta, de novo, é unha análise das publicacións. No sentido máis sinxelo, trátase dunha análise de check-in e xeolocalizacións nas redes sociais, que non borran metadatos jpeg (podes descubrir algo a partir del). Pero para as persoas restantes, adoitan ser emisións de texto: ou ben unha persoa "brilla" a súa localización cando escribe sobre algo, ou "brilla" o seu teléfono, no que podes atopar algúns dos seus anuncios en Avito ou a súa conta en " Auto RU". En base a estes datos, podes combinar (por exemplo, "Vendo un coche preto de Mayakovskaya") e asumilo aproximadamente.

  • A xente adoita publicar isto nas redes sociais. Traballamos só con fontes abertas e aquí falamos exclusivamente de fontes abertas. Adoitan publicar anuncios, é dicir, no sesenta por cento dos casos, a historia máis común cando a xente "mostra" o seu número de móbil actual é anuncios de venda de algo. Ou nalgúns grupos unha persoa escribe (“Vendo isto ou aquelo alí”), ou vai a algún lado.

    Si! Adoitan comentar como: “Contéstame ou envíame un SMS, chama ao meu número. Isto ocorre moi a miúdo coas persoas que venden algo, compran algo nas redes sociais, se comunican con alguén... En consecuencia, mediante este número podes vincular a el o seu perfil en CIAN, se algunha vez publicou algo, ou, de novo, en Avito. Estas son simplemente as fontes máis populares e principais, máis adiante - estes son Avito, CIAN e así por diante.

  • Isto refírese a unha tenda en liña. A continuación estará a tecnoloxía de recoñecemento facial e a correspondencia de perfil (falaremos diso). Teoricamente, isto pódese aplicar a unha tenda sen conexión. E, en xeral, o meu gran soño é que cando aparecen pancartas na rúa, cando pasas por diante dunha cámara, che "atrape" a cara. Pero este caso estará prohibido pola lei porque é unha violación da privacidade. Espero que tarde ou cedo pase.
  • Por experiencia persoal. Moitas veces, cando unha persoa che escribe algo, operas con algúns feitos da súa vida que parece que non deberías saber... A xente na maioría dos casos asústase. Pero! Segundo as estatísticas recentes, o número de contas pechadas nas redes sociais diminuíu un 14%. O número de falsificacións está aumentando, o número de contas abertas crece - a xente está cada vez máis cara á apertura. Creo que en 3-4 anos deixarán de reaccionar con tanta forza ao feito de que alguén coñeza información sobre eles que potencialmente non debería saber. Pero en realidade é moi fácil de conseguir mirando o seu muro.

Que se pode sacar de fontes abertas?

Hai unha lista aproximada de cousas que se poden entender cunha fiabilidade bastante alta desde fontes abertas. De feito, hai aínda máis métricas diferentes; depende do cliente de tal investigación. Hai algunha axencia de RRHH á que lle interesa se xuras nas redes sociais ou nalgún lugar do espazo público. Alguén está interesado en saber se che gustan as publicacións de Navalny ou, pola contra, as publicacións de Rusia Unida, ou algún tipo de contido pornográfico; tales cousas ocorren con bastante frecuencia.

Os principais son os valores familiares, o custo aproximado dun piso, casa, buscar un coche, etc. En base a isto, as persoas pódense dividir en grupos sociais. Estes son os usuarios de Moscow Tinder, quen son (segundo as súas imaxes atopadas nas súas contas de Facebook); en función dos seus intereses, divídense en varios grupos sociais:

Arthur Khachuyan: "Big Data real na publicidade"

Se nos achegamos á publicidade, afastámonos lentamente da orientación publicitaria estándar, cando seleccionas en VKontakte que estás interesado en homes de 18 anos subscritos a determinados grupos. Teño esta imaxe a continuación, xa vos mostrarei:

Arthur Khachuyan: "Big Data real na publicidade"

A conclusión é que a maioría dos servizos actuais que analizan, en principio, persoas que analizan redes sociais, dedícanse a analizar intereses... O primeiro que se lle ocorre á xente é analizar os principais grupos dos seus subscritores. Quizais isto funcione para algúns, pero persoalmente creo que é fundamentalmente incorrecto. Por que?

Os teus gustos recóllense e analízanse

Agora toma os teus teléfonos, mira os teus grupos principais: definitivamente haberá máis do 50 % dos grupos dos que xa esquezas, este é algún tipo de contido que é realmente irrelevante para ti. Non o consumes en absoluto, pero con todo o sistema seguirache segundo eles: que te subscribiches a receitas, a algúns grupos populares. É dicir, violarás o sistema que analiza o teu perfil e non se xustificarán os teus intereses.

Seguindo... Que hai? Asumimos o que están a facer outras persoas. Na nosa opinión, a forma máis adecuada de valorar os intereses dos usuarios son os gustos. Por exemplo, en VKontakte non hai ningún feed de Gústame e a xente pensa que ninguén sabe o que lle gusta. Si, algúns dos Gústame están introducidos en Instagram, algo vemos en Facebook, pero a maioría dos contidos de determinados grupos non o transmiten nun feed común, e a xente vive e pensa que ninguén saberá o que lle gusta.

E recollendo certos contidos dalgún tipo que nos interesen, recollendo estas publicacións, recollendo estes gústame, e despois comprobando esta persoa mediante esta base de datos, podemos determinar con gran precisión quen é, cal é o seu destino, en que lle interesa. Colócao exactamente nun determinado grupo social e interactúa con el.

Comprar un coche cambia o comportamento

Teño un exemplo así. Inmediatamente farei unha reserva de que os meus exemplos son case publicidade e case marketing, porque, xa sabes, a maioría dos casos están protexidos por NDA e así por diante. Pero aínda haberá moitas cousas interesantes. Entón, a historia destas persoas: son homes que compraron un coche entre 2010 e 2015. Como cambiou o seu comportamento social en liña indícase pola cor. A porcentaxe de nenas entre os subscritores cambiou, subscribínme a páxinas públicas "infantiles", atopei unha parella sexual permanente...

Arthur Khachuyan: "Big Data real na publicidade"

Todo isto está desglosado por marca de coche e número de persoas. De aquí podes sacar moitas conclusións interesantes sobre o comportamento das persoas e como funciona todo. Podo dicir que o Porsche Cayenne e o plantado Priora son case idénticos en canto ao número de público atraído. A calidade deste público e o seu comportamento son diferentes, pero a cantidade é aproximadamente a mesma. A conclusión que podes sacar de aquí é o que queiras, máis preto do teu mercado. Se vendes un Audi, creas o slogan "Compra un Audi e escapa dos teus pais!" etcétera.

Si, este é un exemplo divertido do feito de que o comportamento das persoas baseado na análise dos gústame, en función de que grupo se moven, que contido analizan, con case o 100% de probabilidade deixa claro quen es. Porque se non tes acceso ao tráfico da rede e non les mensaxes persoais, os Gústame sempre che dirán quen é esta persoa: unha muller embarazada, unha nai, un militar, un policía. E para ti, como persoa que pode anunciar, este é un gran éxito.

Respostas ás preguntas do público:

  • Cada columna é o número de persoas neste coche; como cambiaron os seus patróns de comportamento. Mira: as persoas que compraron un Porsche Cayenne - aproximadamente 550 persoas (amarelo), aumentou a porcentaxe de nenas entre os subscritores.
  • A mostra son os usuarios das redes sociais "Vkontakte", "Facebook", "Instagram" de 2010 a 2015. A única aclaración: os coches aquí seleccionados son aqueles que se poden identificar en fotografías con máis do 80% de precisión utilizando determinadas ferramentas.
  • Durante un certo período de tempo, o seu coche (ben, é dicir, non o seu, iso deixámolo nas redes sociais)... Durante un determinado período de tempo, unha persoa foi fotografada constantemente co coche, estaba con el, as publicacións. eran diferentes, as fotografías eran desde diferentes ángulos, etc. A continuación, aparecerá unha imaxe da que a xente está a sacar fotos con que coches e... Si, esta é a segunda pregunta: a confianza nos datos das redes sociais.
  • Desde que o presentamos, por desgraza, os datos das redes sociais non sempre son correctos. A xente non sempre está inclinada a publicar a súa información. Persoalmente, realicei un estudo deste tipo: comparei o número de graduados das universidades de Moscova co número de persoas rexistradas nas redes sociais. De media, un 60% máis de persoas están rexistradas nas redes sociais - graduados da Universidade Estatal de Moscova nun determinado ano en determinadas especialidades - do que realmente hai en principio. Entón, si, hai, naturalmente, unha porcentaxe de erros aquí, e ninguén o oculta. Aquí simplemente tomamos como base aqueles coches que se poden identificar con máis do 80% de probabilidade.

Lista de fontes para a formación de modelos

Aquí tes unha mostra de lista de fontes que se poden utilizar, que serve para determinar con gran certeza o perfil social dunha persoa, quen é.

Arthur Khachuyan: "Big Data real na publicidade"

Tomamos un perfil das redes sociais, de CIAN - o custo dun apartamento é aproximadamente, "Head-Hunter", "Superjob" - este é o salario medio para unha determinada persoa. Espero que non haxa representantes de Head Hunter aquí, porque pensan que non é moi bo sacarlles estes datos. Non obstante, este é o salario medio en determinadas rexións para determinados tipos de actividades para vacantes.

"Avito", "Avto.ru": moitas veces a xente, cando o seu teléfono está iluminado, definitivamente o teñen (nun gran número de casos) polo menos algo en "Avito", ou en "Avto.ru", ou noutro varios sitios desde os que podes entender quen son. Se se vendeu un carriño de bebé ou un coche neste número de teléfono... Rosstat e o Rexistro Estatal Unificado de Persoas Xurídicas son aínda máis rexistros coa axuda dos cales pode clasificar a empresa empregadora, segundo algunha fórmula, segundo un modelo que calquera persoa pode configurar (podes determinar aproximadamente o diñeiro desta persoa, etc.).

Tinder axuda a recoller datos sobre a situación das persoas

Ademais, hai algo tan interesante (como alternativa, é moi divertido no estudo): esta é, de novo, a recollida de datos de Moscow Tinder usando bots para este Tinder. Determinouse a distancia ás persoas e despois determinouse a súa localización aproximada.

Arthur Khachuyan: "Big Data real na publicidade"

O obxectivo deste estudo era determinar o número de contas de Tinder no territorio das institucións gobernamentais: na Duma, na fiscalía, etc. Pero ti, como anunciante, podes imaxinar o que queiras: pode ser, por exemplo, Starbucks ou outra persoa... É dicir, a cantidade de persoas de Tinder que che beben café, encargan algo, están nas tendas. Respecto a esta xeolocalización: pódese facer con calquera servizo.

Resposta a unha pregunta do público:

  • Tinder? Non sabes? Tinder é unha aplicación de citas na que miras fotos (esquerda-dereita) e esta aplicación móstrache a distancia ata a persoa. Se obtén a distancia a esta persoa desde tres puntos diferentes, pode aproximadamente (+ 5-7 metros) determinar a localización. Neste caso, para a determinación no territorio da fiscalía ou da Duma do Estado, non é tan difícil. Pero de novo, pode ser a túa tenda, pode ser calquera cousa.

Por exemplo, hai moito, moito tempo tivemos un caso deste tipo (non un estudo), cando recibimos dun dos operadores móbiles datos sobre a densidade de tráfico, datos sobre a densidade de movemento dos puntos móbiles e toda esta información foi superposta. nas coordenadas das cartelerías situadas nas estradas . E a tarefa do operador de telefonía móbil é determinar aproximadamente cantas persoas están pasando e poderían ver este anuncio publicitario.

Se aquí hai especialistas en cartelería, pódese dicir: é imposible entender con súper fiabilidade: alguén vén, alguén non mirou, alguén mirou... Non obstante, este é un exemplo de como hai 20 millóns de polígonos de estes en Moscova, onde está a densidade destas persoas a cada hora en determinadas rutas... Podes ver o que pasaba esta xente en calquera momento e estimar a groso modo o fluxo de pasaxeiros.

Resposta a unha pregunta do público:

  • Ninguén dá tales datos. Levamos a cabo un estudo deste tipo para un dos operadores; esta é unha historia exclusivamente interna, polo que, desafortunadamente, non se presenta en forma de imaxes. Pero moitas veces as grandes axencias de publicidade non teñen problemas para contactar cun operador. Polo menos en Moscova, hai moitos precedentes cando, por exemplo, as compañías de seguros recorren a compañías como GetTaxi, que proporcionan datos impersoais sobre a idade do condutor, como conduce (bo - malo, temerario - non), para prever políticas, etc. Todo o mundo loita con isto, pero nalgún nivel interno, dando datos anónimos, creo que ninguén ten tal problema.

Recoñecemento de imaxes e patróns

Adiante. O meu favorito é o recoñecemento de imaxes. Haberá unha pequena peza sobre a busca de persoas por caras, pero a maioría non tomamos esta parte. Tomamos específicamente o recoñecemento de imaxes e determinamos o que hai nesta imaxe: a marca do coche, a súa cor, etc.

Arthur Khachuyan: "Big Data real na publicidade"

Teño este exemplo divertido:

Arthur Khachuyan: "Big Data real na publicidade"

Houbo un estudo deste tipo sobre a busca de tatuaxes en varias redes sociais. En consecuencia, o mesmo pódese aplicar a calquera marca, a calquera imaxe visual, a case calquera imaxe visual. Hai aqueles que non se poden determinar de forma fiable (non os tomamos).

Arthur Khachuyan: "Big Data real na publicidade"

Aquí está o meu favorito. As marcas de automóbiles recorren moitas veces a esta tarefa porque a súa tarefa, por exemplo, é atopar a todos os propietarios dalgún BMW X6, comprender quen son, como están conectados entre si, que lles interesa, etc. Isto refírese á cuestión de con que coches se tira a xente nas redes sociais.

Arthur Khachuyan: "Big Data real na publicidade"

Aquí non había ningún filtrado: o obxecto era deles, o coche non era deles; É só a avaría dos coches: idade e así por diante. Pero o recoñecemento visual de imaxes utilízase con bastante frecuencia: esta é a busca de mulleres embarazadas e a busca de logotipos de marca nalgún tipo de medios de comunicación (quen publica que).

Arthur Khachuyan: "Big Data real na publicidade"

O meu caso favorito (que é usado por varios restaurantes): que tipo de rolos se publican nunha rede social. É algo divertido, pero de feito permíteche comprender moitas cousas interesantes, en primeiro lugar, sobre os teus propios clientes: quen chegou a ti e por que o fixeron. Porque non é ningún segredo que nos bares de sushi, a maioría da xente (non vou dicir "mozas") sacan fotos para facer o check-in, facer unha foto de algo, etc.

A marca pode aproveitar isto. A marca está interesada en que tipo de produtos necesita para fotografar e publicar moi ben, que tipo de xente chegou alí. Isto pódese facer con case calquera cousa, dende a comida.

Recoñecemento de patróns de vídeo

Resposta a unha pregunta do público:

  • Non en vídeo. Témolo en modo de proba. Probamos esta tecnoloxía, pero resulta que... Recoñéceo todo bastante ben con vídeo, pero non atopamos unha aplicación para iso por ningures. Adeus. Ademais de analizar canto e que videoblogueros falan nalgún lado... Houbo un estudo así. Cantas das súas caras se atopan, cantas veces. Pero as marcas aínda non descubriron onde chegar a isto. Quizais algún día chegue.

De novo, esta é comida, pode ser mulleres embarazadas, homes (non embarazadas), coches - calquera cousa.

Como opción, houbo un estudo de ano novo para un medio de comunicación. Tamén lonxe da publicidade, pero aínda así. Este é o tipo de comida que a xente xaxunou para o ano novo:

Arthur Khachuyan: "Big Data real na publicidade"

Aquí tamén se desglosa por idade. Podes ver tal correlación que os mozos sobre todo piden comida, os adultos sobre todo fan unha mesa tradicional. É algo divertido, pero imaxinalo como propietario dunha marca, podes avaliar un gran número de cousas: quen manexa o teu produto e como, que escriben sobre el. Moitas veces, a xente non sempre menciona a propia marca no texto, e os sistemas tradicionais de seguimento analítico non sempre poden entender e atopar esta mención á marca só porque non se menciona no texto. Ou o texto está mal escrito, non hai etiquetas hash nin nada.

As fotos son visibles. Coa fotografía, podes saber se é o suxeito central do cadro ou non o suxeito central do cadro. Entón podes ver o que escribiu esta persoa. Pero a maioría das veces úsase como unha busca de público potenciais que conduciu certos coches, etc. E despois faremos moitas cousas interesantes con estes coches.

Ensínaselles aos bots a imitar aos humanos

Tamén había unha opción para usar a conta de persoas:

Arthur Khachuyan: "Big Data real na publicidade"

Hai unha opción para comparar persoas, cando necesitas atopar persoas usando algunhas fotografías, comprender o seu perfil social, quen son. De novo, volvemos á pregunta de que se temos unha cámara nunha tenda fóra de liña, esta é unha boa forma de entender quen chega a ti, quen son estas persoas, que lles interesa, que lles levou a acudir a ti. .

A continuación vén o máis interesante: se recollemos as súas contas nas redes sociais, entendemos quen son estas persoas, que lles interesa, podemos (como opción) facer un bot semellante a estas persoas; este bot comezará a vivir coma esta xente e analizará que anuncios ve en varias redes sociais. Isto permitirache comprender con precisión que marcas están dirixidas a esta persoa. Esta é tamén unha historia bastante común cando precisa non só analizar quen é esta persoa e que intereses ten, senón tamén a que tipo de publicidade deberían orientar os seus potenciais competidores ou outras persoas interesadas.

Arthur Khachuyan: "Big Data real na publicidade"

Análise de conexións nas redes sociais

Arthur Khachuyan: "Big Data real na publicidade"

O seguinte interesante é a análise das relacións entre as persoas. En realidade, a análise das conexións na rede, estes gráficos de rede - non hai un pouco, nada novo nisto, todo o mundo sábeo.

Arthur Khachuyan: "Big Data real na publicidade"

Pero a aplicación a tarefas publicitarias é a máis interesante. Trátase dunha busca de persoas que marcan tendencias, trátase dunha busca de persoas que difunden información segundo determinados criterios dentro desta rede. Digamos que nos interesan os mesmos propietarios dun determinado modelo de BMW. Ao xuntalos todos, podemos atopar os que controlan a opinión pública. Estes non son necesariamente bloggers de automóbiles, etc. Normalmente son simples camaradas que están sentados en varias páxinas públicas, están interesados ​​nalgún contido e poden, nun período de tempo moi curto, atraer a túa marca ou alguén do teu interese a esta área de responsabilidade, á área de ​interese.

Hai un exemplo deste tipo aquí. Temos algunhas persoas potenciais, conexións entre persoas. Aquí os laranxas son persoas, os pequenos puntos son grupos comúns, amigos comúns.

Arthur Khachuyan: "Big Data real na publicidade"

Se recolles todas estas conexións entre eles, podes ver moi claramente que hai xente que ten un gran número de grupos comúns, amigos comúns, están aí entre eles... E se esta mesma visualización se divide en grupos por intereses, por contido, que distribúen, canto interactúan entre si... Aquí podedes ver que a imaxe anterior quedou así:

Arthur Khachuyan: "Big Data real na publicidade"

Aquí os grupos distínguense claramente pola cor. Neste caso, trátase dos nosos alumnos de máster da Escola Superior de Economía. Aquí podes ver que os morados/azuis son os que adoran as páxinas públicas de Transparency International, Open Russia e Khodorkovsky. Abaixo á esquerda están os verdes, os que aman a Rusia Unida.

Podes ver que a imaxe anterior era así (son só conexións entre persoas), pero quedou claramente delimitada. É dicir, todas as persoas están sempre conectadas entre elas, teñen os mesmos intereses, son amigas entre elas. Hai uns enriba, outros no fondo, e algúns outros compañeiros alí. E se cada un destes pequenos subgrafos se visualiza por separado con outros parámetros e observa a velocidade de difusión dos contidos (en grandes liñas, quen volve publicar o que alí), podes atopar en cada parte unha ou dúas persoas que sempre teñen a opinión pública nas súas mans, interactuando co que, pedindo enviar algún tipo de publicación ou outra cousa - podes obter unha resposta de todo este público interesante.

Teño outro exemplo deste tipo. Tamén un gráfico: son os empregados do Grupo BBDO que se atopan nas redes sociais como exemplo. Parece pouco interesante, grande, verde, conexións entre eles...

Arthur Khachuyan: "Big Data real na publicidade"

Pero teño unha opción onde xa están construídos grupos entre eles. Despois, se alguén está interesado, hai unha versión interactiva: podes facer clic e botarlle unha ollada.

Arriba á dereita están os que aman a Putin. Aquí os morados son os deseñadores; os que estean interesados ​​no deseño, algo interesante, etc. Aquí as cousas brancas son o equipo directivo (ao parecer, segundo entendo); Trátase de persoas que, en xeral, non están conectadas de ningún xeito, pero traballan aproximadamente nos mesmos postos. O resto son os seus grupos comúns, conexións, etc.

As marcas non necesitan bloggers, senón líderes de opinión

Collemos a estas persoas e atopámolas; entón a axencia de publicidade, a empresa de publicidade decide por si mesma: pode darlle diñeiro a esta persoa para que interactúe dalgún xeito con este contido, con outra cousa, ou dirixirlles a súa propia campaña publicitaria específica. Isto tamén se usa con bastante frecuencia, especialmente agora, porque todas as marcas queren traballar con bloggers, queren que se promocione o seu contido, pero as axencias de publicidade non queren contactar (ben, isto ocorre).

E a verdadeira saída a esta situación é atopar persoas que non sexan blogueiras, non blogueiras de beleza, pero, por exemplo, algúns seres reais que interactúan con esta marca, que poidan escribir nunha miserable páxina pública "Respostas de Mail.ru", obter un determinado número de vistas. Estas persoas, que están constantemente interesadas no contido desta persoa, difundirán todo e a marca conseguirá a súa implicación.

A segunda opción para usar esa tecnoloxía agora é bastante relevante: buscar bots, o meu favorito. Este é un risco para a reputación dos teus competidores e unha oportunidade para eliminar persoas irrelevantes dunha campaña publicitaria e calquera outra cousa (eliminar comentarios e buscar conexións entre persoas). Teño un exemplo deste tipo, tamén é grande e interactivo: podes movelo. Estas son conexións de persoas que escribiron comentarios na comunidade de Lentach.

Este exemplo é para que comprenda o ben e o fácil que son os bots; e para iso non é preciso ter ningún coñecemento técnico. Isto significa que "Lentach" publicou unha publicación sobre a investigación da FBK sobre Dmitry Medvedev, e certas persoas comezaron a escribir comentarios. Recollimos todas as persoas que escribiron comentarios: estas persoas son verdes. Agora vouno mover:

Arthur Khachuyan: "Big Data real na publicidade"

A xente é a verde (que escribiu os comentarios). Están aquí, están aquí. Os puntos azuis entre eles son os seus grupos comúns, os puntos amarelos son os seus subscritores comúns, amigos, etc. A maioría das persoas están conectadas entre si. Porque, sexa cal sexa a teoría de tres, catro, cinco apretóns de mans, todas as persoas están conectadas entre si nas redes sociais. Non hai persoas que estean separadas unhas das outras. Incluso os meus amigos socialmente fóbicos que usan VKontakte exclusivamente para ver vídeos aínda están subscritos a algunhas das mesmas páxinas públicas ca nós.

Navalny tamén usa bots. Todo o mundo ten bots

A maior parte da xente (aquí está, aquí) está conectada entre si. Pero hai un grupo tan pequeno de compañeiros que son amigos exclusivamente entre si. Aquí están, os pequenos verdes, aquí os seus amigos e grupos en común. Incluso caeron por separado aquí:

Arthur Khachuyan: "Big Data real na publicidade"

E por unha afortunada coincidencia, foron precisamente estas persoas as que escribiron baixo esta publicación: "Navalny non ten probas" e así por diante, e escribiron os mesmos comentarios. Por suposto, non me atrevo a sacar conclusións. Pero con todo, tiven outra publicación en Facebook, cando houbo un debate entre Lebedev e Navalny, analizei os comentarios do mesmo xeito: resultou que toda a xente que escribiu “Lebedev é unha merda”, non estiveran nas redes sociais. Redes recentemente catro meses, non subscrito a ningunha das páxinas públicas, de súpeto foi a esta publicación en particular, escribiu este comentario exacto e marchou. De novo, é imposible sacar conclusións de aquí, pero alguén do equipo de Navalny escribiume un comentario de que non usan bots. Ben, vale!

Máis preto da publicidade, máis preto da marca. Todo o mundo ten bots agora! Témolos, téñenos os nosos competidores e téñenos outros. Hai que botalos ou deixalos para vivir ben; Con base en tales datos (apunta á diapositiva anterior), perfecciónaos para que se vexan como persoas reais e só despois utilízaos. Aínda que usar bots é malo! Con todo, unha historia bastante común...

No modo automático, tal cousa permítelle filtrar da súa análise as persoas que son irrelevantes para a análise, persoas que non deberían incluírse na mostra, non deberían incluírse neste estudo. Usado moi a miúdo. Por outra banda, non todos os propietarios de coches realmente posúen coches. Ás veces, a xente só está interesada en persoas que potencialmente teñen un coche, que se senten nalgúns grupos, se comunican con alguén, teñen un determinado público alí.

Análise de feitos e opinións

O seguinte que teño tamén é o meu favorito. Esta é unha análise de feitos e opinións.

Arthur Khachuyan: "Big Data real na publicidade"

Hoxe en día todo o mundo sabe como mencionar a súa marca en varias fontes. Non hai ningún segredo para isto. E todo o mundo parece que é capaz de calcular a tonalidade... Aínda que persoalmente, penso que a métrica da tonalidade en si non é moi interesante, porque cando chegas a dicirlle ao cliente: “Home, tes un 37% de neutral”, e el di así. , "Guau! Genial!" Polo tanto, sería máis interesante avanzar un pouco máis: dende a avaliación do sentimento ata a valoración das opinións do que din sobre o teu produto.

E isto tamén é algo moi interesante, porque... Persoalmente creo que en principio non pode haber mensaxes neutras, porque se unha persoa escribe algo no espazo público, esta mensaxe está dalgún xeito coloreada de calquera xeito. Persoalmente, nunca vin unha mensaxe neutral mencionando unha marca. Normalmente é algún tipo de sucidade.

Se tomamos un gran número destas mensaxes (pode haber millóns, 10 millóns), destacamos a idea principal de cada mensaxe, combínaas, podemos entender de forma bastante fiable o que a xente di sobre esta marca, o que pensa. "Non me gusta o envase", "Non me gusta a consistencia", etc.

Que pensa a xente sobre Transaero, Chupa Chups e o presidente dos Estados Unidos?

Teño un exemplo divertido: trátase dunha infografía sobre o que farían os usuarios das redes sociais coa empresa Transaero despois da súa quebra.

Arthur Khachuyan: "Big Data real na publicidade"

Hai moitos exemplos interesantes alí: queimar, matar, deportar a Europa, incluso houbo un 2% que escribiu: "Envíaos a Siria para operacións militares". Pasando do divertido, podería ser case calquera marca, desde a miña comida favorita para cans ata algúns coches. A quen non lle gusta a embalaxe, a quen non lle gustan as cousas reais, sempre podes traballar con isto, sempre podes telo en conta. Hai un gran número de exemplos nos que a xente case cambiou a produción dos seus produtos porque escribiu nas redes sociais que Chupa Chups non era o suficientemente redondo ou non era o suficientemente doce.

Hai outro exemplo divertido. Adiviña que comentarios e sobre quen?

Arthur Khachuyan: "Big Data real na publicidade"

Por algo, agora a análise de opinións, a análise de feitos extraídos das mensaxes, é pouco usada e pouco estendida. Aínda que esta tecnoloxía non é súper secreta, non hai prácticamente ningún know-how nisto, porque dos comentarios da xente, extraer o suxeito, predicado e agrupalos non require un xenio en lingüística computacional. Non é tan difícil de facer. Pero espero que nos próximos anos a xente comece a usar isto, porque... Será xenial: este é un feedback tan automático! Sempre sabes o que din de ti. Ben, entendes que isto se fixo sobre o presidente dos Estados Unidos.

Resposta a unha pregunta do público:

  • Si, isto é Facebook en inglés. Aquí están traducidos ao ruso. Isto foi escrito nalgún lugar.

Big Data e tecnoloxías políticas

De feito, teño moitos exemplos interesantes de política sobre Trump e todos os demais, pero decidimos non traelos aquí. Pero hai un exemplo político.

Son eleccións á Duma Estatal. Cando eras? O ano pasado? Hai case ano e medio.

Arthur Khachuyan: "Big Data real na publicidade"

Aquí están persoas que puideron determinar a súa localización exacta, ata un xeopunto determinado, para entender en que recinto electoral se atopan. E entón destas persoas só se sacaron os que expresaron a súa opinión definitiva, polos que votarían.

Dende o punto de vista da tecnoloxía política, isto non é moi correcto, porque todo isto debe ser normalizado pola densidade de poboación, etc. Así e todo, os azuis de aquí van votar xa sabedes a quen, os vermellos van votar aos compañeiros da oposición, dos que, por certo, non foron moitos.

Persoalmente creo que o Big Data non chegará pronto ás tecnoloxías políticas, pero, como opción, o candidato tamén é unha marca. E isto é tamén, ata certo punto, unha análise de feitos e opinións sobre a túa marca, e algo bastante interesante, porque podes entender en tempo real quen fai que. Coñezo varios casos da BBC, nos que vixiaban as redes sociais en tempo real nalgunha emisión: houbo tal ou tal resposta, a xente escribe sobre ela, fai tal ou cal pregunta, e é xenial! Creo que se utilizará moi pronto, porque é interesante para todos.

Modelado de posicións de marca

Arthur Khachuyan: "Big Data real na publicidade"

A continuación teño o modelado de posicións de marca. Esta é unha pequena e breve peza sobre como podes clasificar as marcas usando varias métricas (non os gusta dos subscritores nas redes sociais, pero usando métricas complexas, interese polo contido, tempo dedicado a recibir métricas).

Arthur Khachuyan: "Big Data real na publicidade"

Teño un exemplo de "farmacia" por certo motivo. Aquí os círculos pequenos son internos, brillantes: esta é a cantidade de contido de texto que crea a propia marca, o círculo grande é a cantidade de contido fotográfico e de vídeo que crea a propia marca.

A proximidade ao centro mostra o interesante que é o contido para o público. Hai un gran modelo, hai unha morea de todo tipo de parámetros: gustos, repostos, tempo de resposta, quen compartiu alí de media... Aquí podes ver: hai un marabilloso “Kagotsel”, que bombea unha enorme cantidade de diñeiro para crear o seu propio contido, e debido a iso están bastante preto do centro. E hai compañeiros que tamén crean os seus propios contidos, pero ao público non lle interesa. Este non é un exemplo moi axeitado, porque todas estas contas están practicamente mortas.

Yegor Creed é máis querido que Basta

Arthur Khachuyan: "Big Data real na publicidade"

Por desgraza, o resto... do que mostrar... Pois tamén hai raperos rusos, como opción, de compañías reais.

Cal é o plus? O caso é que unha empresa pode poñer case calquera cousa nun modelo deste tipo, empezando polo salario medio dos abonados que traballan para a súa marca; calquera modelo que lles guste. Dado que cada axencia de publicidade calcula as súas propias métricas de forma diferente, as marcas calculan as súas propias métricas de forma diferente.

Tamén hai un aquí - Basta, que xera unha gran cantidade de contido, pero está situado na periferia, porque este contido aparentemente non é moi interesante para o público. De novo, non presumo de xulgar. Pero, con todo, está Yegor Creed, que, segundo as redes sociais, é case o mellor intérprete do noso tempo, pero publica só as súas fotografías persoais. Non obstante, ten un gran número de subscritores: hai preto dun millón deles. Non lembro o número exacto; Lembro que a porcentaxe de compromiso destas persoas é moito máis alta que o 85%, é dicir, por millón de subscritores recibe 850 mil respostas destas persoas reais, isto é unha auténtica loucura. É verdade.

Arthur Khachuyan: "Big Data real na publicidade"

Respostas ás preguntas do público:

Canto tempo levou crear o modelo de análise do rapero?

  • Cada un ten o seu propio público obxectivo, os intereses destas persoas calcúlanse para cada un... Todo isto normalízase á distancia ao centro aproximadamente, a súa posición radial non é importante (aquí simplemente se unta por beleza, para que o fagan). non chocar entre eles). Só é importante a proximidade aproximada co centro. Este é o modelo que usamos. Por exemplo, gústame máis o círculo, algunhas persoas fano en mente como un semicírculo.
  • Este modelo recompilouse rapidamente, en dúas ou tres horas (si, unha persoa). Aquí só se inseriron métricas: o que multiplicamos por que, sumámolo e logo normalízao dalgún xeito. Depende do modelo. Hai xente que está interesada no salario medio (non é unha broma) dos seus abonados. E para iso cómpre atopar os seus contactos, Avito, calculalo todo, multiplicalo. Ocorre que isto leva moito tempo telo en conta, pero concretamente isto (apunta á diapositiva anterior): os parámetros aquí son moi sinxelos: subscritores, republicacións, etc. Tardou entre dúas e tres horas en completarse. En consecuencia, esta cousa actualízase en tempo real e podes usala.

Agora vén a parte divertida. Remato con exemplos, porque non é interesante falar moito tempo só. E espero que agora fagades preguntas e, de feito, imos pasar de tema en tema, porque teño exemplos deste tipo de como se poden usar as tecnoloxías e así por diante...

Respostas ás preguntas do público:

  • Tiven un e único caso persoal cun, por así dicilo, "near-casino", cando alí se colocaba unha cámara, recoñecíanse rostros, etc. A porcentaxe de persoas recoñecidas é, sen dúbida, bastante grande, tanto a nosa como a dos nosos competidores. Pero en realidade é bastante interesante. Vexo isto como algo interesante: podes entender quen son estas persoas e predecir bastante ben por que viñeron aquí exactamente, o que cambiou tanto nas súas vidas que decidiron vir ao casino. Pero en canto a tipos específicos de negocios... Se colocas tal cousa nunha farmacia, non ten sentido: non podes predecir por que unha persoa chegou á farmacia.

    A tarefa global aquí foi construír un modelo para comprender cando unha persoa quere potencialmente interesarse pola túa marca, para que poidas darlle publicidade non despois de que comprase algo (como está a suceder agora), senón darlle publicidade ". en previsión” de cando sucederá todo isto. Foi interesante cun "near-casino" así; Resultou que había unha porcentaxe bastante interesante destas persoas - por que: alguén recibiu de súpeto unha promoción, outra persoa conseguiu outra cousa - unha visión tan interesante. Pero con algunhas tendas, con venda polo miúdo, cunha tenda dalgún tipo de pastillas, paréceme que non vai ser moi correcto.

O Big Data úsase fóra de liña?

  • Estaba sen conexión. Só tes que entender exactamente, aproximadamente, se este modelo encaixará ou non. De novo, con auga con gas... En realidade me interesa todo, pero persoalmente non entendo canto, como poden depender os perfís destas persoas, o seu comportamento de cando queiran comprar auga embotellada. Aínda que isto poida ser verdade, non o sei.

Cantas contas de redes sociais hai abertas?

  • Temos específicamente 11 redes sociais: estas son "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagram" e algunhas pequenas cousas (podo mirar a lista, como "Mail.ru" e así por diante) . En VKontakte definitivamente temos unha copia de todos estes compañeiros. Temos xente en VKontakte, é dicir, 430 millóns de todos os que existiron (dos cales uns 200 millóns están constantemente activos); hai grupos, hai conexións entre estas persoas e hai contidos que nos interesan (texto), e unha parte dos medios de comunicación, pero moi pequenos... A grandes rasgos, miramos esta imaxe: se hai caras alí, nós gárdaos, se hai un meme, gardámolos Non o gardamos, porque nin sequera teriamos o suficiente para gardar o contido multimedia.

    Hai un Facebook en ruso. Nalgún lugar agora o 60-80% son Odnoklassniki, nun par de meses probablemente os levaremos todos ata o final. Instagram ruso. Para todas estas redes sociais hai grupos, persoas, conexións entre elas e texto.

  • Uns 400 millóns de persoas. Hai unha sutileza: hai persoas cuxa cidade non está especificada (son potencialmente rusas / non rusas); Destes, a media das redes sociais é do 14% das contas pechadas en VKontakte, non sei a cifra exacta en Facebook.
  • Tampouco gardamos medios en Instagram, só se hai caras alí. Non almacenamos estes (outros) contidos multimedia. Normalmente interesantes: só texto, conexións entre persoas; Todos. A investigación máis común en Instagram é a habitual sobre a audiencia: quen son estas persoas e, o máis importante, a conexión destas con outras redes sociais. Busca o perfil desta persoa en Vkontakte e Facebook para calcular a súa idade e así por diante.
  • Aínda non hai necesidade de enfrontarse a todos os demais, simplemente porque non hai clientes. Respecto ao idioma: temos ruso, inglés, español, pero aínda así se usa exclusivamente para marcas de Rusia; ben, ou as empresas que os traen de Rusia.
  • Entrevistamos a xente todos os días en moitos, moitos, moitos fíos: recompilamos datos recopilando a web e actualizamos estes indicadores mediante Api. En 2-3 días podes pasar por todo o "VKontakte", pasando por eles; En aproximadamente unha semana podes percorrer todo o Facebook, entendendo quen actualizou que e que non. E despois volve reunir estas persoas por separado: o que cambiou exactamente, escribe toda esta historia. Na miña experiencia, moi poucas veces se utilizou o antigo perfil de redes sociais de alguén para un propósito comercial real. Era o momento no que se presentou unha figura política, e a súa tarefa consistía en entender que tipo de persoas chegan á sede, quen eran estas persoas hai 6-8 meses (borraron o seu perfil, pero de feito para outro candidato chegaron as papeletas? estragar).

    E un par de veces: historias persoais cando as fotografías de alguén foron publicadas no dominio público. Era necesario buscar conexións, etc. Desafortunadamente, é unha mágoa, pero non podemos declarar no xulgado, porque a nosa base de datos é legalmente ilíquida.

  • O almacenamento MongoDB é o meu favorito.

As redes sociais intentan loitar contra a recollida de datos

  • Normalmente cargamos só unha lista destas contas aos anunciantes, e despois usan a estándar... É dicir, nas redes sociais, en VKontakte, podes especificar unha lista destas persoas.

    Pero Facebook usa cookies compradas. Nós mesmos non traballamos con cookies, pero houbo varias historias cando o propio anunciante deu a algunhas persoas, interactuamos con elas: teñen estas redes, con publicidade teaser, non teaser, estas "cookies". Podes atalo - sen dúbida! Pero non me gusta moito este material porque non creo que sexa moi auténtico. Isto é puramente na miña opinión, é como TNS, que "rastrexa" os televisores: non está claro se estás vendo este televisor ou non, se estás lavando a louza mentres a túa televisión está acesa... E é o mesmo aquí. : Moitas veces busco en Google algo en Internet, pero iso non significa que queira mercalo.

  • Se está a usar algún tipo de rede de publicidade contextual estándar: tiven varias historias cando lles descargamos a estas persoas e intentamos, usando as súas interfaces, conectalas con "cookies" nos seus sitios. Pero non me gustan moito esas cousas.

Fórmula para calcular o salario dun internauta

  • A fórmula xeral do salario medio: esta é a rexión onde vive unha persoa, esta é a categoría de negocio na que traballa (é dicir, a empresa que é o seu empregador), entón tómase o seu posto nesta empresa, a media o salario para este posto estímase... Salario medio extraído de "Head Hunter" e "Superjob" (e hai varias outras fontes) para unha determinada vacante nunha determinada rexión e para un determinado contexto empresarial.

    Desde "Avito" e "Avto.ru" adoitan tomarse parámetros adicionais se unha persoa ilumina o teléfono. Con Avito podes ver que tipo de cousas está a vender unha persoa: caras, baratas, usadas, non usadas. Con "Avto.ru" podes ver se ten un coche: é o propietario, non o ten. Este é nalgún lugar menos do 20 % das persoas que deixaron caer o teléfono accidentalmente nalgún lugar, e a súa conta pódese vincular a estes datos.

Que volumes opera a empresa de recollida de datos?

  • O volume de fotografías almacenadas en petabytes é de 6,4. Non podo dicir exactamente a taxa de crecemento agora, porque en 2016 comezamos a gravar "periscopios" e só comezamos a gravar vídeo.

    Non podo dicir exactamente cando foi cero. Pasamos de empresa en empresa: todas estas son historias longas. Pero podo dicir que VK, Facebook, Instagram e Twitter -todo este negocio (persoas, grupos e conexións entre eles) con texto e contido- en realidade non son moitos datos, é improbable que ata un petabyte teña o suficiente. Creo que son 700 gigabytes, probablemente 800.

Axudas aos clientes a determinar o nicho actual e onde cavar?

  • Cando chega un cliente, suxerímoslle tales cousas, pero nós mesmos, como Google Trends, non facemos tales cousas.
  • Tivemos varias historias case sociolóxicas, con historia electoral, preelectoral -analámolo todo-. Coas marcas e a valoración das opinións sobre as marcas, case sempre todo coincide. Aquí tes historias de eleccións e eleccións: non (cunha avaliación de que candidato debería gañar). Non sei quen está equivocado aquí: nós, ou os que pensan en VTsIOM.
  • Normalmente tomamos estes resultados de control da propia marca, tómano de compañeiros que encargan investigación: investigación telefónica, investigación de mercados, etc. Ademais, todo isto pódese comprobar con cousas básicas: alguén respondeu á lista de correo, alguén fixo enquisas... Se é unha gran marca (Coca-Cola, por exemplo), definitivamente teñen un millón ou dúas de críticas internas dos clientes. – non son só comentarios en redes sociais e algunhas opinións; Estes son algún tipo de sistemas internos, revisións, etc.

A lei non "sabe" que son os datos persoais!

  • Analizamos exclusivamente fontes de datos abertas e nunca nos involucramos en trucos sucios. O noso modelo baséase no feito de almacenar todos os datos abertos nalgúns centros de datos públicos, alugalos noutro lugar e analizalos na casa, nas nosas oficinas, nos nosos servidores, e non vai a ningún lado fóra do territorio.

    Pero a nosa lexislación en materia de datos abertos é moi vaga.

    Non temos unha comprensión clara do que son os datos abertos, que son os datos persoais; hai esta Lei Federal número 152, pero aínda así... Como contan? Agora ben, se nunha base de datos teño o teu nome e o teu número de teléfono, noutra teño o teu número de teléfono e o teu correo electrónico, nunha terceira teño, por exemplo, o teu correo electrónico e o teu coche; Todo isto parece ser datos non persoais. Se xuntas todo isto, parece que segundo a lei pasarán a ser datos persoais.

    Conseguimos isto de dous xeitos. O primeiro é instalar un servidor con software para o cliente, e despois estes datos non van máis aló do seu territorio, e despois o cliente é o responsable da distribución destes datos persoais, datos non persoais, etc. Ou a segunda opción: se se trata dunha historia na que hai que demandar a unha rede social ou outra cousa...

    Tivemos un estudo deste tipo cando recollemos (había primarias de Rusia Unida) para Lifenews as contas destes compañeiros e miramos que tipo de porno lles gustaba. Foi algo divertido, pero aínda así. Vendemos isto como opinión propia, persoal, sen revelar legalmente nos documentos o que analizamos: o Rexistro Único Estatal de Persoas Xurídicas, os salarios, as redes sociais; Vendemos opinión de expertos, e despois á marxe explicámoslle á persoa o que analizamos e como.
    Había varias historias, pero estaban relacionadas con algúns proxectos comerciais públicos. Por exemplo, temos un proxecto gratuíto sen ánimo de lucro para aqueles que montan en longboards (estes taboleiros son longos): a tarefa era recoller as publicacións da xente, cando alguén publica "Fun ao parque Gorky dar un paseo". E agora debería entrar no mapa, e a xente ao seu redor pode ver que alguén está preto del. VK estivo moi atento a nós sobre este tema durante moito tempo, porque non lles gustou o feito de que publicáramos esta información sen o permiso da xente. Pero entón o asunto non chegou aos tribunais, porque dentro de varias grandes comunidades sumamos á normativa que os datos podían ser utilizados por terceiros, organismos, empresas, análises, etc. Por suposto, non era especialmente ético, pero aínda así.

  • Acabamos de darnos conta a tempo e comezamos a vender a nosa opinión experta a todos.

Traballa con institucións educativas?

  • Cooperamos con institucións educativas, si. Temos toda unha oferta: temos un máster na Escola Superior, e colaboramos con outras universidades. Queremos moito as universidades!
  • Se tes os meus contactos, podes escribirme. E unha ligazón á presentación, se alguén está interesado - todos estes exemplos están alí, pode movelo.
  • Se coñeces o número de teléfono, o correo electrónico - esta é unha opción case cen por cento, ninguén o eliminará. Se non hai número de teléfono, adoita ser unha imaxe; se non hai imaxe, é o ano, o lugar de residencia, o traballo. É dicir, por ano, lugar de residencia e traballo, case todo o mundo sempre pode identificarse de forma bastante sutil. Pero esta, de novo, é unha pregunta sobre a tarefa.

    Temos, digamos, un cliente que vende televisión por Internet. Alguén comproulles unha subscrición a estes "Xogos de Tronos" e a tarefa é usar o seu CRM para atopar a estas persoas nas redes sociais e, a continuación, atopar outras potenciais da súa área de influencia. Só quero dicir que teñen, por exemplo, nome, apelidos e correo electrónico... E logo é moi difícil facer nada. Na maioría dos casos, a xente pódese atopar por correo electrónico.

  • En función da composición dos nosos amigos, adoitamos "coincidir" con persoas nas redes sociais, pero isto non sempre é correcto. Non é que non sempre sexa correcto, non sempre funciona. En primeiro lugar, isto require moita man de obra, porque esta operación (combinación de persoas) terá que realizarse primeiro para cada un dos amigos, para entender se viñeron das redes sociais ou non. E entón - un feito descoñecido para calquera que en VKontakte temos os mesmos amigos, en Facebook temos amigos diferentes. Non para todos, pero para min, por exemplo, é así; e isto tamén é certo para a maioría da xente.

Como se recollen os datos máis completos?

  • Instalación de software para o cliente do seu lado. Neles está instalado un servidor, que só nos toma datos públicos e procesa os seus datos persoais internamente. Conclúese un NDA co cliente. Isto, por suposto, non é moi correcto que nos transfiran isto, pero a responsabilidade legal recae no cliente, é dicir, instalar software para el ou transferir datos anónimos. Pero isto era moi raro, porque -anonimización correcta ou incorrecta- na maioría dos casos pérdese a dependencia entre estas persoas.

Quen compra software de recoñecemento facial?

  • De feito, imos aquí porque o noso software principal que vendemos é a busca facial, a análise de correlación e vendémolo a axencias gobernamentais. E hai ano e medio, decidimos poñer todas estas historias na publicidade, no mercadotecnia, no mercado público; así foi como se formou Social Data Hub, unha entidade xurídica comercial. E agora só estamos chegando aquí. Levamos ano e medio aquí, intentando explicarlle á xente que non hai que facerlle descargas con mención, que hai que darlle respostas ás preguntas, que non hai necesidade de tonalidade. , etcétera. Entón, é difícil dicir onde...
  • (A quen te refires?) A todos os compañeiros que necesiten buscar terroristas e pederastas.
    Podo dicir de inmediato (esta será a seguinte pregunta): segundo os nosos datos, ningún profesor foi encarcerado por repostar.
  • En VKontakte - 14%; en Facebook non hai un perfil pechado como tal (hai unha lista pechada de amigos, etc.). E o máis interesante é que acabo de escribir unha mensaxe, agora contarán e dirán.

Non publiques algo do que te avergoñarás!

  • Non publiques nada nas redes sociais que che dean vergoña: eu persoalmente sigo isto. Aínda que tiven moitas persoais, porque xuro en Facebook. Pois había e había algo que facer... Non publiques nada que sexa vergoñento! Se máis tarde vas traballar nalgún lugar da Sala Pública, si, mellor non opinar. Se non vas facer isto, en xeral, a ninguén lle importa. Só che podo asegurar que ninguén le a túa correspondencia persoal, e todo isto está a construír toda esta historia...

    Todas as semanas, definitivamente alguén vén a min e di: "Ben, as fotos do meu amigo filtáronse a algunha páxina pública anónima! Axuda! Por certo, nunca publiques nada en páxinas públicas anónimas.

  • Descoñezo outros sistemas de vixilancia, seguro que teremos isto en conta, que a mención á marca foi negativa, Deus me perdoe... Pero podo dicir que todo tipo de compañeiros próximos ao estado só lles interesa a xente. que teñen unha audiencia de máis de 5 mil, e a súa opinión pública pode influír en alguén, entón influír. Segundo a miña experiencia, nunca ocorreu que a axencia de RRHH que nos encarga a valoración do perfil dixese: "A quen lle guste Navalny, non contrate a ninguén!"

Sobre a publicación dos resultados. Cantas persoas están empregadas na investigación?

  • Das 10 principais empresas de publicidade, sete están publicando. É difícil dicir: cando comezamos isto hai ano e medio... Temos varias persoas en cada área: hai varias persoas nos bancos, hai varias persoas en RRHH, hai varias persoas en publicidade. E agora estamos a pensar en quen é máis rendible acudir primeiro, para quen hai que comezar a facer algunhas interfaces...
  • (sobre o número de persoas por segmento de mercado) Non máis de 25 persoas, porque non violamos a ninguén.
  • En xeral, en principio, estas tecnoloxías do mercado utilízanse, creo, en máis do 50%. Algúns en campañas publicitarias, outros nalgún tipo de análise interna. Eu diría que o 40 por cento utilízao en análises internas, o 50-60 por cento véndeo para marcas finais. Pero isto xa depende das propias empresas de publicidade. Verás, algunhas persoas denuncian simplemente polo diñeiro gastado, a publicidade que poñen, mentres que outras escriben sobre cantas persoas trouxeron, que tipo de público... Eu diríao, pero podería estar equivocado, non o fago. Realmente non imaxino como traballan todos estes compañeiros. Só sei en datos cuantitativos.

Algúns anuncios 🙂

Grazas por estar connosco. Gústanche os nosos artigos? Queres ver máis contido interesante? Apóyanos facendo un pedido ou recomendando a amigos, Cloud VPS para desenvolvedores desde 4.99 $, un análogo único de servidores de nivel de entrada, que inventamos nós para ti: Toda a verdade sobre VPS (KVM) E5-2697 v3 (6 núcleos) 10 GB DDR4 480 GB SSD 1 Gbps desde 19 dólares ou como compartir un servidor? (dispoñible con RAID1 e RAID10, ata 24 núcleos e ata 40 GB DDR4).

Dell R730xd 2 veces máis barato no centro de datos Equinix Tier IV en Amsterdam? Só aquí 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV desde $199 nos Países Baixos! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - desde $ 99! Ler sobre Como construír a infraestrutura corp. clase co uso de servidores Dell R730xd E5-2650 v4 por valor de 9000 euros por un centavo?

Fonte: www.habr.com

Engadir un comentario