Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

La 14-an de marto 2017, Arthur Khachuyan, Ĉefoficisto de Social Data Hub, parolis ĉe la BBDO-prelego. Arthur parolis pri inteligenta monitorado, konstruado de kondutismaj modeloj, rekonado de foto kaj video-enhavo, same kiel aliaj iloj kaj esplorado de Social Data Hub, kiuj ebligas al vi celi spektantarojn uzante sociajn retojn kaj Big Data-teknologiojn.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Artur Khachuyan (ĉi-poste - AH): - Saluton! Saluton al ĉiuj! Mi nomiĝas Arthur Khachuyan, mi administras la kompanion Social Data Hub, kaj ni okupiĝas pri diversaj interesaj intelektaj analizoj de malfermitaj datumfontoj, informkampoj kaj faras ĉiajn interesajn esplorojn ktp.

Kaj hodiaŭ kolegoj de BBDO-Grupo petis nin paroli pri modernaj teknologioj por analizi grandajn datumojn, grandajn kaj ne tiom grandajn datumojn por reklamado: kiel ĝi estas uzata, montru kelkajn interesajn ekzemplojn. Mi esperas, ke vi demandos dumvoje, ĉar mi povas enuigi kaj ne malkaŝi la esencon kaj tiel plu, do ne timu.

Fakte, la ĉefaj direktoj, kie iam estis uzataj iaj "preskaŭ grandaj datumoj" solvoj," ili ĉiuj estas klaraj - ĉi tio estas spektantaro celado, analizo, farado de ia analiza merkatada esploro. Sed ĉiam estas interese, kiaj aldonaj datumoj troveblas, kiaj aldonaj signifoj troveblas post aplikado de la analizo.

Kial ni bezonas teknologion por reklamado?

De kie ni komencu? La plej evidenta afero estas reklamado en sociaj retoj. Hodiaŭ mi demetis ĝin matene: ial VKontakte opinias, ke mi devus vidi ĉi tiun apartan reklamon... Ĉu ĝi estas bona aŭ malbona estas la dua demando. Ni vidas, ke mi certe falas en la kategorion de soldatoj:

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

La plej unua kaj plej interesa afero, kiu povas esti prenita kiel teknologia solvo... La unua afero, kiun mi volis decidi antaŭ ol komenci, estas difini la terminojn: kio estas malfermaj datumoj kaj kio estas grandaj datumoj? Ĉar ĉiuj homoj havas sian propran komprenon pri ĉi tiu afero, kaj mi ne volas trudi miajn kondiĉojn al iu ajn, sed... Nur por ke ne estu diferencoj.

Persone, mi pensas, ke malfermaj datumoj estas ĉio, kion mi povas atingi sen iu ajn ensaluto aŭ pasvorto. Ĉi tio estas malfermita profilo en sociaj retoj, tio estas serĉrezultoj, ĉi tiuj estas malfermitaj registroj ktp. Grandaj datumoj, laŭ mia propra kompreno, mi vidas ĝin tiel: se ĝi estas datumplato, ĝi estas miliardo da vicoj, se ĝi estas ia speco. de dosierstokado, ĝi estas ie petabajto da datumoj. La resto en mia terminologio ne estas grandaj datumoj, sed io tia.

Altprecizega profilado kaj profilpoentado

Ni iru en ordo. La plej unua kaj plej interesa afero, kiun vi povas elpensi analizante malfermajn datumfontojn, estas altpreciza profilado kaj profilpoentado. Kio estas ĉi tio? Ĉi tio estas rakonto, kie via socia retokonto povas antaŭdiri ne nur kiu vi estas, ne nur viajn interesojn.

Sed nun, kombinante diversajn fontojn, vi povas kompreni la averaĝan nivelon de via salajro, kiom kostas via apartamento, kaj kie ĝi situas. Kaj ĉiuj ĉi tiuj datumoj povas esti uzataj laŭvorte de disponeblaj rimedoj. Ekzemple, se vi prenas vian konton en socia reto, rigardu, ekzemple, kie vi loĝas, kie vi laboras; komprenu, en kiu sekcio de la komerco estas la firmao, por kiu vi laboras; elŝutu similajn vakantaĵojn de HH kaj "Superjob" se vi estas analizisto, administranto ktp.; rigardu kie vi loĝas (bazo, diru CIAN), komprenu kiom kostas por lui hejmon en ĉi tiu loko, kiom kostas aĉeti hejmon en ĉi tiu loko, antaŭdiru proksimume kiom vi gajnas. Plue, uzante viajn sociajn retojn, vi povas kompreni kiom vi vojaĝas, kie vi estas, kaj kiom lojala vi estas al via dunganto.

Sekve, el tia grandega nombro da metrikoj ni povas fari ĉion, kion ni volas. Ni povas prezenti vin al produkto kiu interesas vin. Ĉu vi povas imagi interretan vendejon? Vi iras tien - ĉi tiu interreta vendejo kaptas vian konton en socia reto kaj diras al vi: "Maŝa, vi ĵus disiĝis kun via koramiko, jen iuj produktoj por vi." Ĉi tio ne estas la proksima estonteco...

Kiel estas determinita la geolokigo de homo?

Respondoj al demandoj de la publiko:

  • Tipe, 80% de ĉiuj enskriboj estas konsiderataj kiel la preciza loĝloko. Sed por homoj, kiuj nenie eniras, ekzistas pluraj ebloj: aŭ enregistriĝo, aŭ geolokigo, aŭ ĉi tio estas analizo de afiŝoj kaj publikaĵoj por la tuta tempodaŭro, kiam homo skribis ion... Kaj ie, io aperos kiel "Mi volas aĉeti infanĉaron proksime de Akademicheskaya" aŭ "Mi lastatempe vidis malbelajn grafitiojn sur la muro ĉi tie." Tio estas, por preskaŭ 80% de homoj, ilia geolokigo, ilia laborloko kaj ilia loĝloko povas esti determinitaj per datumoj aŭ metadatenoj kiuj povas esti kolektitaj de sociaj retoj.

    Ĉi tio, denove, estas analizo de afiŝoj. En la plej simpla signifo, ĉi tio estas analizo de enskriboj kaj geolokigoj en sociaj retoj, kiuj ne forigas jpeg-metadatumojn (vi povas eltrovi ion el ĝi). Sed por la ceteraj homoj, ĉi tiuj kutime estas tekstaj elsendoj: aŭ persono "brilas" sian lokon kiam li skribas pri io, aŭ li "brilas" sian telefonon, per kiu vi povas trovi iom da lia reklamado ĉe Avito aŭ lia konto ĉe " Aŭtomata RU". Surbaze de ĉi tiuj datumoj, vi povas kombini (ekzemple, "Mi vendas aŭton proksime de Majakovskaya") kaj proksimume supozi ĉi tion.

  • Homoj kutime afiŝas ĉi tion en sociaj retoj. Ni laboras nur kun malfermitaj fontoj kaj ĉi tie ni parolas ekskluzive pri malfermitaj fontoj. Ili kutime publikigas reklamojn, tio estas, en sesdek procentoj de kazoj, la plej ofta rakonto kiam homoj "montris" sian nunan poŝtelefonnumeron estas reklamoj pri vendo de io. Aŭ en kelkaj grupoj homo skribas (“Mi vendas ĉi tion aŭ tion tie”), aŭ iras ien.

    Jes! Ili kutime komentas kiel: “Respondu al mi aŭ sendu al mi SMS, voku mian numeron. Tio tre ofte okazas al homoj, kiuj ion vendas, aĉetas ion en sociaj retoj, komunikas kun iu... Sekve, uzante ĉi tiun numeron oni povas tiam ligi lian profilon ĉe CIAN al ĝi, se li iam publikigis ion, aŭ , denove, sur Avito. Ĉi tiuj estas simple la plej popularaj, ĉefaj fontoj, ĝi estos plu - ĉi tiuj estas Avito, CIAN ktp.

  • Ĉi tio rilatas al reta vendejo. Poste estos la teknologio de vizaĝa rekono kaj profila kongruo (ni parolos pri ĝi). Nur teorie, ĉi tio povas esti aplikata al eksterreta vendejo. Kaj ĝenerale, mia granda revo estas, ke kiam aperas stratstandardoj, kiam vi preterpasas fotilon, ĝi "kaptas" vian vizaĝon. Sed ĉi tiu kazo estos malpermesita de leĝo ĉar ĝi estas malobservo de privateco. Mi esperas, ke ĝi okazos baldaŭ aŭ malfrue.
  • El persona sperto. Tre ofte, kiam homo skribas ion al vi, vi operacias pri iuj faktoj de lia vivo, kiujn vi ŝajne ne konas... Homoj plejofte timiĝas. Sed! Surbaze de lastatempaj statistikoj, la nombro da fermitaj kontoj en sociaj retoj malpliiĝis je 14%. La nombro da falsaĵoj pliiĝas, la nombro da malfermitaj kontoj kreskas - homoj ĉiam pli moviĝas al malfermiteco. Mi pensas, ke post 3-4 jaroj ili ĉesos reagi tiel forte al tio, ke iu konas informojn pri ili, kiujn ili eble ne devus scii. Sed efektive estas tre facile atingi rigardante lian muron.

Kion oni povas preni el malfermaj fontoj?

Estas proksimuma listo de aferoj, kiuj povas esti komprenitaj kun sufiĉe alta fidindeco de malfermaj fontoj. Fakte, estas eĉ pli malsamaj metrikoj; ĝi dependas de la kliento de tia esplorado. Estas iu HR-agentejo, kiu interesiĝas pri ĉu vi ĵuras en sociaj retoj aŭ ie en publika spaco. Iu interesiĝas pri ĉu vi ŝatas la publikaĵojn de Navalny aŭ, male, Unuiĝintan Rusion, aŭ ian pornografian enhavon - tiaj aferoj okazas sufiĉe ofte.

La ĉefaj estas familiaj valoroj, la proksimuma kosto de apartamento, hejmo, serĉado de aŭtomobilo ktp. Surbaze de tio, homoj povas esti dividitaj en sociajn grupojn. Ĉi tiuj estas uzantoj de Moskva Tinder, kiuj ili estas (laŭ iliaj bildoj trovitaj sur siaj Facebook-kontoj); surbaze de iliaj interesoj, ili estas dividitaj en diversajn sociajn grupojn:

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Se ni alproksimiĝas al reklamado, tiam ni malrapide malproksimiĝis de norma reklama celado, kiam vi elektas en VKontakte, ke vi interesiĝas pri 18-jaraj viroj abonintaj al certaj grupoj. Mi havas ĉi tiun bildon poste, mi montros al vi nun:

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

La fundo estas, ke la plej multaj el la nunaj servoj, kiuj analizas, principe, homojn, kiuj analizas sociajn retojn, okupiĝas pri analizado de interesoj... La unua afero, kiu venas en la menson de homoj, estas analizi la ĉefajn grupojn de siaj abonantoj. Eble ĉi tio funkcias por iuj, sed persone mi pensas, ke ĝi estas fundamente malĝusta. Kial?

Viaj ŝatoj estas kolektitaj kaj analizitaj

Nun prenu viajn telefonojn, rigardu viajn plej bonajn grupojn - certe estos pli ol 50% de grupoj, pri kiuj vi jam forgesis, ĉi tio estas ia enhavo, kiu efektive ne gravas por vi. Vi tute ne konsumas ĝin, sed tamen la sistemo spuros vin laŭ ili: ke vi abonis receptojn, al iuj popularaj grupoj. Tio estas, vi malobservos la sistemon, kiu analizas vian profilon, kaj viaj interesoj ne estos pravigitaj.

Pluen... Kio estas tie? Ni supozas, kion aliaj homoj faras. Laŭ nia opinio, la plej taŭga maniero por taksi la interesojn de uzantoj estas ŝatoj. Ekzemple, en VKontakte ne estas ŝatataj feed, kaj homoj pensas, ke neniu scias, kion ili ŝatas. Jes, kelkaj ŝatoj estas enkondukitaj en Instagram, ni vidas ion en Fejsbuko, sed la plej granda parto de la enhavo en certaj grupoj ne dissendas ĉi tion en komuna nutrado, kaj homoj vivas kaj pensas, ke neniu scios, kion ili ŝatas.

Kaj kolektante certan enhavon de iu speco, kiu interesas nin, kolektante ĉi tiujn afiŝojn, kolektante ĉi tiujn ŝatojn, poste kontrolante ĉi tiun personon uzante ĉi tiun datumbazon, ni povas determini kun alta precizeco kiu li estas, kio estas lia destino, pri kio li interesiĝas. Metu lin precize en certan socian grupon kaj interagu kun li.

Aĉeti aŭton ŝanĝas konduton

Mi havas tian ekzemplon. Mi tuj faros rezervon, ke miaj ekzemploj estas preskaŭ reklamaj kaj preskaŭ-merkatado, ĉar, vi scias, la plej multaj kazoj estas protektitaj de NDA kaj tiel plu. Sed ankoraŭ estos multaj interesaj aferoj. Do, la rakonto kun ĉi tiuj homoj: ĉi tiuj estas viroj, kiuj aĉetis aŭton inter 2010 kaj 2015. Kiel ilia interreta socia konduto ŝanĝiĝis, estas indikita per koloro. La procento de knabinoj inter abonantoj ŝanĝiĝis, mi abonis al "knabaj" publikaj paĝoj, trovis konstantan seksan partneron...

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Ĉi tiu tuta afero estas dividita laŭ aŭtomarko kaj nombro da homoj. De ĉi tie vi povas tiri multajn interesajn konkludojn pri la konduto de homoj kaj kiel ĉio funkcias. Mi povas diri, ke la Porsche Cayenne kaj la plantita Priora estas preskaŭ identaj laŭ la nombro de altiritaj spektantaroj. La kvalito de ĉi tiu publiko kaj ilia konduto estas malsamaj, sed la kvanto estas proksimume la sama. La konkludo, kiun vi povas eltiri de ĉi tie, estas kion ajn vi volas, pli proksime al via merkato. Se vi vendas Audi, vi faras la sloganon "Aĉetu Audi kaj foriru de viaj gepatroj!" kaj tiel plu.

Jes, ĉi tio estas amuza ekzemplo de la fakto, ke la konduto de homoj surbaze de la analizo de ŝatoj, surbaze de kiu grupo ili moviĝas, kian enhavon ili analizas - kun preskaŭ 100% probableco ĝi evidentigas, kiu vi estas. Ĉar se vi ne havas aliron al rettrafiko kaj ne legas personajn mesaĝojn, ŝatoj ĉiam diros al vi, kiu estas ĉi tiu persono - graveda virino, patrino, militisto, policisto. Kaj por vi, kiel homo, kiu povas reklami, ĉi tio estas granda sukceso.

Respondoj al demandoj de la publiko:

  • Ĉiu kolumno estas la nombro da homoj en ĉi tiu aŭto; kiel iliaj kondutpadronoj ŝanĝiĝis. Rigardu: homoj, kiuj aĉetis Porsche Cayenne - proksimume 550 homoj (flava), la procento de knabinoj inter abonantoj pliiĝis.
  • La specimeno estas uzantoj de sociaj retoj "Vkontakte", "Facebook", "Instagram" de 2010 ĝis 2015. La sola klarigo: la aŭtoj elektitaj ĉi tie estas tiuj, kiuj povas esti identigitaj en fotoj kun pli ol 80% precizeco uzante certajn ilojn.
  • Dum certa tempo, lia aŭto (nu, tio estas, ne lia, ni lasas tion al sociaj retoj)... Dum certa tempo, homo estis konstante fotita kun la aŭto, estis kun ĝi, la publikaĵoj. estis malsamaj, la fotoj estis el malsamaj anguloj, ktp. Poste estos bildo pri kiu homoj fotas, per kiuj aŭtoj kaj... Jes, jen la dua demando - fidu al datumoj de sociaj retoj.
  • Ĉar ni alportis ĝin, bedaŭrinde, datumoj pri sociaj amaskomunikiloj ne ĉiam estas ĝustaj. Homoj ne ĉiam emas publikigi siajn informojn. Persone, mi faris tian studon: mi komparis la nombron da diplomiĝintoj de Moskvaj universitatoj kun la nombro da homoj registritaj en sociaj retoj. Averaĝe, 60% pli da homoj estas registritaj en sociaj retoj - diplomiĝintoj de Moskva Ŝtata Universitato en certa jaro en certaj fakoj - ol fakte estas principe. Do jes - estas, nature, procento da eraroj ĉi tie, kaj neniu kaŝas ĝin. Ĉi tie ni simple prenas kiel bazon tiujn aŭtojn, kiuj povas esti identigitaj kun pli ol 80% probablo.

Listo de fontoj por modela trejnado

Jen specimena listo de fontoj uzeblaj, kiu estas uzata por determini kun granda certeco la socian profilon de homo, kiu li estas.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Ni prenas profilon de sociaj retoj, de CIAN - la kosto de apartamento estas proksimume, "Head-Hunter", "Superjob" - ĉi tiu estas la averaĝa salajro por difinita persono. Mi esperas, ke ĉi tie ne estas reprezentantoj de Head Hunter, ĉar ili pensas, ke ne estas tre bone preni ĉi tiujn datumojn de ili. Tamen, ĉi tio estas la averaĝa salajro en certaj regionoj por iuj specoj de agadoj por vakantaĵoj.

"Avito", "Avto.ru": tre ofte homoj, kiam ilia telefono estas lumigita, ili certe havas ĝin (en granda nombro da kazoj) almenaŭ ion sur "Avito", aŭ sur "Avto.ru", aŭ sur alia pluraj retejoj de kiuj vi povas kompreni kiuj ili estas. Se per tiu ĉi telefonnumero vendiĝis infanĉaro aŭ aŭto... Rosstat kaj la Unuigita Ŝtata Registro de Juraj Entoj estas ankoraŭ pli da registroj, per kiuj vi povas rangigi la dungantan kompanion - laŭ iu formulo, laŭ modelo, kiu iu ajn povas agordi (vi povas proksimume determini la monon de ĉi tiu persono ktp.).

Tinder helpas kolekti datumojn pri la situacio de homoj

Krome, ekzistas tia interesa afero (alternative, ĝi estas tre amuza en la studo) - jen denove la kolekto de datumoj de Moskva Tinder uzanta robotojn por ĉi tiu Tinder. La distanco al homoj estis determinita, kaj tiam ilia proksimuma loko estis determinita.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

La celo de ĉi tiu studo estis determini la nombron da Tinder-kontoj sur la teritorio de registaraj institucioj - en la Dumao, la oficejo de la prokuroro, ktp. Sed vi, kiel reklamanto, povas imagi kion ajn vi volas: ĝi povus esti, ekzemple, Starbucks aŭ iu alia... Tio estas, la nombro da homoj ĉe Tinder, kiuj trinkas kafon de vi, mendis ion, estas en vendejoj. Koncerne ĉi tiun geolokigon: ĉi tio povas esti farita per iu ajn servo.

Respondo al demando de la publiko:

  • Tinder? Vi ne scias? Tinder estas rendevua programo, kie vi trarigardas fotojn (maldekstre-dekstre), kaj ĉi tiu programo montras al vi la distancon al la persono. Se vi ricevas la distancon al ĉi tiu persono de tri malsamaj punktoj, vi povas proksimume (+ 5-7 metroj) determini la lokon. En ĉi tiu kazo, por determino sur la teritorio de la prokurorejo aŭ la Ŝtata Dumao, ĝi ne estas tiel malfacila. Sed denove, ĝi povus esti via vendejo, ĝi povus esti io ajn.

Ekzemple, antaŭ longe, longa tempo ni havis tian kazon (ne studon), kiam ni ricevis de unu el la ĉelaj telefonistoj datumojn pri trafikdenseco, datumojn pri la denseco de movado de ĉelaj punktoj, kaj ĉiuj ĉi informoj estis supermetitaj. sur la koordinatoj de afiŝtabuloj situantaj sur ŝoseoj . Kaj la tasko de la ĉela operatoro estas determini proksimume kiom da homoj preterpasas kaj eble povus vidi ĉi tiun reklaman reklamon.

Se ĉi tie estas specialistoj pri reklamaj afiŝtabulo, oni povas diri: estas neeble kompreni per superfidindeco - iu venas, iu ne rigardis, iu rigardis... Tamen ĉi tio estas ekzemplo de kiel ekzistas 20 miliardoj da pluranguloj de ĉi tiuj en Moskvo, sur kiu estas la denseco de tiuj homoj ĉiuhore laŭ certaj vojoj... Vi povas vidi, kion ĉi tiuj homoj en ĉiu momento preterpasas kaj proksimume taksi la pasaĝerfluon.

Respondo al demando de la publiko:

  • Neniu donas tiajn datumojn. Ni faris tian studon por unu el la funkciigistoj; ĉi tio estas ekskluzive interna rakonto, do, bedaŭrinde, ĝi ne estas prezentita en formo de bildoj. Sed ofte grandaj reklam-agentejoj ne havas problemojn kontakti operatoron. Almenaŭ en Moskvo, ekzistas multaj precedencoj kiam, ekzemple, asekurkompanioj turnas sin al kompanioj kiel GetTaxi, kiuj provizas nepersonajn datumojn pri la aĝo de la ŝoforo, kiel ili veturas (bone - malbona, malzorgema - ne), por antaŭdiri. politikoj kaj tiel plu. Ĉiuj luktas kun ĉi tio, sed je iu interna nivelo, donante anonimajn datumojn - mi pensas, ke neniu havas tian problemon.

Bildo kaj Ŝablona Rekono

Antaŭeniri. Mia plej ŝatata estas bildo-rekono. Estos eta peco pri serĉado de homoj laŭ vizaĝoj, sed ni plejparte ne prenas ĉi tiun parton. Ni prenas specife bildrekonon kaj determini kio estas en ĉi tiu bildo - la marko de la aŭto, ĝia koloro, ktp.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Mi havas ĉi tiun amuzan ekzemplon:

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Estis tia studo pri serĉado de tatuoj en diversaj sociaj retoj. Sekve, la sama povas esti aplikata al ajna marko, al ajna vida bildo, al preskaŭ ajna vida bildo. Estas tiuj, kiuj ne povas esti fidinde determinitaj (ni ne prenas ilin).

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Jen mia plej ŝatata. Aŭtomarkoj sufiĉe ofte turnas sin al ĉi tiu tasko ĉar ilia tasko, ekzemple, estas trovi ĉiujn posedantojn de iuj BMW X6, kompreni kiuj ili estas, kiel ili estas konektitaj unu al la alia, pri kio ili interesiĝas, ktp. Ĉi tio rilatas al la demando pri per kiaj aŭtoj homoj fotas en sociaj retoj.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Ĉi tie tute ne estis filtrado: la objekto estis ilia, la aŭtomobilo ne estis ilia; Ĝi estas nur la paneo de aŭtoj - aĝo kaj tiel plu. Sed vida bilda rekono estas uzata sufiĉe ofte: ĉi tio estas la serĉo de gravedaj virinoj, kaj la serĉo de markemblemoj en ia amaskomunikilaro (kiu afiŝas kion).

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Mia plej ŝatata kazo (kiu estas uzata de diversaj restoracioj): kiaj bulkoj estas afiŝitaj en socia reto. Ĝi estas amuza afero, sed fakte ĝi permesas vin kompreni multajn interesajn aferojn, unue, pri viaj propraj klientoj: kiuj venis al vi kaj kial ili faris ĝin. Ĉar ne estas sekreto, ke en suŝio-trinkejoj, plej multaj homoj (mi ne diros "knabinoj") fotas por enregistriĝi, foti ion, ktp.

La marko povas utiligi ĉi tion. La marko interesiĝas pri kiaj produktoj ĝi bezonas por bele foti kaj afiŝi, kiaj homoj venis tien. Ĉi tiu afero povas esti farita per preskaŭ io ajn, de manĝaĵo.

Video-ŝablono-rekono

Respondo al demando de la publiko:

  • Ne en video. Ni havas ĝin en testreĝimo. Ni provis ĉi tiun teknologion, sed rezultas, ke... Ĝi sufiĉe bone rekonas ĉion per video, sed ni ne trovis aplikaĵon por ĝi ie ajn. Adiaŭ. Krom analizi kiom kaj kiuj videoblogantoj ie parolas... Estis tia studo. Kiom da iliaj vizaĝoj renkontiĝas, kiom ofte. Sed markoj ankoraŭ ne eltrovis kie elpensi ĉi tion. Eble iam ĝi venos.

Denove, ĉi tio estas manĝaĵo, ĝi povas esti gravedaj virinoj, viroj (ne gravedaj), aŭtoj - io ajn.

Eble, estis novjara studo por unu amaskomunikilaro. Ankaŭ malproksime de reklamado, sed tamen. Jen kiaj manĝaĵoj fastis homoj por la Novjaro:

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Ĝi ankaŭ estas malkonstruita laŭ aĝo ĉi tie. Vi povas vidi tian korelacion, ke junuloj plejparte mendas manĝaĵojn, plenkreskuloj plejparte faras tradician tablon. Ĝi estas amuza afero, sed imagante ĝin kiel markoposedanto, vi povas taksi grandan nombron da aferoj: kiu pritraktas vian produkton kaj kiel, kion ili skribas pri ĝi. Ofte, homoj ne ĉiam mencias la markon mem en la teksto, kaj tradiciaj analizaj monitoraj sistemoj ne ĉiam povas kompreni kaj trovi ĉi tiun mencion de la marko nur ĉar ĝi ne estas menciita en la teksto. Aŭ la teksto estas misliterumita, ne estas hash-etikedoj aŭ io ajn.

La fotoj estas videblaj. Kun fotado, vi povas diri ĉu ĝi estas la centra temo de la kadro aŭ ne la centra temo de la kadro. Tiam vi povas vidi kion ĉi tiu homo skribis. Sed plej ofte ĝi estas uzata kiel serĉo de eblaj spektantaroj, kiuj veturis certajn aŭtojn ktp. Kaj tiam ni faros multajn interesajn aferojn kun ĉi tiuj aŭtoj.

Botoj estas instruitaj imiti homojn

Ekzistis ankaŭ tia opcio por uzi homojn nombradon:

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Estas eblo por kompari homojn, kiam vi bezonas trovi homojn uzante iujn fotojn, kompreni ilian socian profilon, kiuj ili estas. Denove ni revenas al la demando, ke se ni havas fotilon en eksterreta vendejo, tiam ĉi tio estas sufiĉe bona maniero kompreni, kiu venas al vi, kiuj estas ĉi tiuj homoj, pri kio ili interesiĝas, kio instigis ilin veni al vi. .

Poste venas la plej interesa afero: se ni kolektas iliajn kontojn en sociaj retoj, komprenos kiuj estas ĉi tiuj homoj, pri kio ili interesiĝas, ni povas (laŭ elekto) fari bot similan al ĉi tiuj homoj; ĉi tiu bot komencos vivi kiel ĉi tiuj homoj kaj analizos kiajn reklamojn ĝi vidas en diversaj sociaj retoj. Ĉi tio permesos al vi precize kompreni, kiuj markoj celas ĉi tiun personon. Ĉi tio ankaŭ estas sufiĉe ofta rakonto, kiam vi devas ne nur analizi, kiu estas ĉi tiu persono kaj kiajn interesojn li havas, sed ankaŭ kian reklamadon devas celi viaj eblaj konkurantoj aŭ aliaj interesitaj homoj.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Analizo de rilatoj en sociaj retoj

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

La sekva interesa afero estas la analizo de rilatoj inter homoj. Fakte, la analizo de konektoj en la reto, ĉi tiuj retaj grafikaĵoj - ne estas iom, nenio nova en ĉi tio, ĉiuj scias ĉi tion.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Sed la aplikaĵo al reklamaj taskoj estas la plej interesa. Ĉi tio estas serĉo de homoj, kiuj starigas tendencojn, ĉi tiu estas serĉo de homoj, kiuj disvastigas informojn laŭ certaj kriterioj ene de ĉi tiu reto. Ni diru, ke ni interesiĝas pri la samaj posedantoj de certa BMW-modelo. Kunigante ilin ĉiujn, ni povas trovi tiujn, kiuj regas la publikan opinion. Ĉi tiuj ne nepre estas aŭtomobilaj blogantoj ktp. Kutime ĉi tiuj estas simplaj kamaradoj, kiuj sidas en diversaj publikaj paĝoj, interesiĝas pri iu enhavo kaj povas, en tre mallonga tempodaŭro, altiri vian markon aŭ iun interesan por vi en ĉi tiun respondecon, en la areo de ​intereso.

Estas tia ekzemplo ĉi tie. Ni havas iujn eblajn homojn, ligojn inter homoj. Ĉi tie la oranĝaj estas homoj, la malgrandaj punktoj estas komunaj grupoj, komunaj amikoj.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Se vi kolektas ĉiujn ĉi ligojn inter ili, vi povas tre klare vidi, ke ekzistas homoj, kiuj havas grandan nombron da komunaj grupoj, komunaj amikoj, ili estas tie inter si... Kaj se ĉi tiu sama bildigo estas dividita en grupojn laŭ interesoj, laŭ enhavo, kiun ili distribuas, kiom ili interagas inter si... Ĉi tie vi povas vidi, ke la antaŭa bildo fariĝis tiel:

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Ĉi tie la grupoj estas klare distingitaj per koloro. En ĉi tiu kazo, ĉi tiuj estas niaj majstraj studentoj ĉe la Supera Lernejo de Ekonomiko. Ĉi tie vi povas vidi, ke la purpuraj/bluaj estas tiuj, kiuj amas la publikajn paĝojn de Travidebleco Internacia, Malferma Rusio kaj Ĥodorkovskij. Malsupre maldekstre estas la verdaj, tiuj kiuj amas Unuegan Rusion.

Vi povas vidi, ke la antaŭa bildo estis tia (ĉi tio estas nur rilatoj inter homoj), sed klare distingiĝis. Tio estas, ĉiuj homoj ĉiam estas ligitaj unu kun la alia, ili havas la samajn interesojn, ili estas amikoj unu kun la alia. Estas iuj supre, aliaj malsupre, kaj iuj aliaj kamaradoj tie. Kaj se ĉiu el ĉi tiuj malgrandaj subgrafeoj estas aparte bildigita kun aliaj parametroj kaj rigardas la rapidecon de disvastigo de enhavo (proksimume, kiu repostas kion tie), oni povas trovi en ĉiu parto unu aŭ du homojn, kiuj ĉiam tenas publikan opinion en siaj manoj, interagante kun kiu, petante sendi ian afiŝon aŭ ion alian - vi povas ricevi respondon de ĉi tiu tuta interesa publiko.

Mi havas alian tian ekzemplon. Ankaŭ grafikaĵo: ĉi tiuj estas dungitoj de BBDO Group trovitaj en sociaj retoj kiel ekzemplo. Ĝi aspektas neinteresa, granda, verda, ligoj inter ili...

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Sed mi havas eblon, kie grupoj jam estas konstruitaj inter ili. Tiam, se iu interesiĝas, ekzistas interaga versio - vi povas klaki kaj rigardi.

Supre dekstre estas tiuj, kiuj amas Putin. Ĉi tie la purpuraj estas la dezajnistoj; tiuj kiuj interesiĝas pri dezajno, io interesa, ktp. Ĉi tie la blankaj aferoj estas la administra teamo (ŝajne, kiel mi komprenas); Ĉi tiuj estas homoj, kiuj ĝenerale ne estas ligitaj iel, sed laboras en proksimume la samaj postenoj. La resto estas iliaj komunaj grupoj, ligoj, ktp.

Markoj ne bezonas blogantojn, sed opiniestrojn

Ni prenas ĉi tiujn homojn kaj trovas ilin - tiam la reklam-agentejo, la reklam-kompanio decidas por si mem: ĝi povas doni monon al ĉi tiu persono por ke li iel interagas kun ĉi tiu enhavo, io alia, aŭ direkti sian propran specifan reklam-kampanjon al ili. Ĉi tio ankaŭ estas uzata sufiĉe ofte, precipe nun, ĉar ĉiuj markoj volas labori kun blogantoj, ili volas, ke ilia enhavo estu promociita, sed reklamagentejoj ne vere volas kontakti (nu, tio okazas).

Kaj la vera eliro el ĉi tiu situacio estas trovi homojn, kiuj ne estas blogantoj, ne belecaj blogantoj, sed ekzemple, iuj realaj estaĵoj, kiuj interagas kun ĉi tiu marko, kiuj povas skribi en iu mizera publika paĝo "Mail.ru Respondoj", akiri certa nombro da vidoj. Ĉi tiuj homoj, kiuj konstante interesiĝas pri la enhavo de ĉi tiu persono, disvastigos la tuton, kaj la marko ricevos sian implikiĝon.

La dua opcio por uzi tian teknologion nun estas sufiĉe grava - serĉi robotojn, mia plej ŝatata. Ĉi tio estas reputacia risko por viaj konkurantoj, kaj ŝanco forigi senrilatajn homojn el reklama kampanjo, kaj io ajn alia (forigado de komentoj kaj serĉado de rilatoj inter homoj). Mi havas tian ekzemplon, ĝi ankaŭ estas granda kaj interaga - vi povas movi ĝin. Ĉi tiuj estas rilatoj de homoj, kiuj skribis komentojn en la Lentach-komunumo.

Ĉi tiu ekzemplo estas por ke vi komprenu kiom bone kaj facile videblaj bots estas; kaj por tio vi ne bezonas havi ajnan teknikan scion. Ĉi tio signifas, ke "Lentach" publikigis afiŝon pri la FBK-enketo pri Dmitry Medvedev, kaj iuj homoj komencis skribi komentojn. Ni kolektis ĉiujn homojn, kiuj skribis komentojn - ĉi tiuj homoj estas verdaj. Nun mi movos ĝin:

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

La homoj estas la verdaj (kiu skribis la komentojn). Ili estas ĉi tie, ili estas ĉi tie. La bluaj punktoj inter ili estas iliaj komunaj grupoj, la flavaj punktoj estas iliaj komunaj abonantoj, amikoj, ktp. La plej granda parto de homoj estas ligitaj unu kun la alia. Ĉar, kia ajn estas la teorio de tri, kvar, kvin manpremoj, ĉiuj homoj estas konektitaj unu al la alia en sociaj retoj. Ne ekzistas homoj, kiuj estas apartigitaj unu de la alia. Eĉ miaj socifobiaj amikoj, kiuj uzas VKontakte ekskluzive por spekti filmetojn, ankoraŭ estas abonitaj al iuj el la samaj publikaj paĝoj kiel ni.

Navalny ankaŭ uzas robotojn. Ĉiuj havas robotojn

La plejparto de homoj (jen ĝi estas, ĉi tie) estas ligitaj unu kun la alia. Sed ekzistas tia grupeto da kamaradoj, kiuj estas amikoj ekskluzive unu kun la alia. Jen ili, la etuloj verdaj, jen iliaj reciprokaj amikoj kaj grupoj. Ili eĉ defalis aparte ĉi tie:

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Kaj pro bonŝanca koincido, ĝuste ĉi tiuj homoj skribis sub ĉi tiu afiŝo: "Navalny ne havas pruvojn" kaj tiel plu, skribis la samajn komentojn. Kompreneble, mi ne kuraĝas tiri konkludojn. Sed tamen, mi havis alian afiŝon en Fejsbuko, kiam okazis debato inter Lebedev kaj Navalny, mi analizis la komentojn sammaniere: montriĝis, ke ĉiuj homoj, kiuj skribis "Lebedev estas feko", ili ne estis en la socia. retoj lastatempe kvar monatojn, ne abonitaj al iu ajn el la publikaj paĝoj, subite iris al ĉi tiu aparta afiŝo, skribis ĉi tiun precizan komenton kaj foriris. Denove, estas neeble tiri konkludojn de ĉi tie, sed iu el la teamo de Navalny skribis al mi komenton, ke ili ne uzas bots. Nu, bone!

Pli proksime al reklamado, pli proksime al la marko. Ĉiuj havas robotojn nun! Ni havas ilin, niaj konkurantoj havas ilin, kaj aliaj havas ilin. Ili devas esti elĵetitaj aŭ lasitaj por bone vivi; Surbaze de tiaj datumoj (montras al la antaŭa lumbildo), perfektigu ilin por ke ili aspektu kiel realaj homoj kaj nur tiam uzu ilin. Kvankam uzi bots estas malbone! Tamen, sufiĉe ofta rakonto...

En aŭtomata reĝimo, tia afero ebligas al vi filtri el via analizo homojn, kiuj estas senrilataj al la analizo, homoj, kiuj ne devus esti inkluditaj en la specimeno, ne estu inkluditaj en ĉi tiu studo. Tre ofte uzata. Tiam denove, ne ĉiuj aŭtoposedantoj efektive posedas aŭtojn. Foje homoj nur interesiĝas pri homoj, kiuj eble havas aŭton, kiuj sidas en iuj grupoj, komunikas kun iu, ili havas certan publikon tie.

Analizo de faktoj kaj opinioj

La sekva, kiun mi havas, ankaŭ estas mia plej ŝatata. Ĉi tio estas analizo de faktoj kaj opinioj.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Nuntempe ĉiuj scias kiel mencii sian markon en diversaj fontoj. Ne estas sekreto al ĉi tio. Kaj ĉiuj ŝajnas kapablaj kalkuli tonalecon... Kvankam persone, mi pensas, ke la tonalmetriko mem ne estas tre interesa, ĉar kiam vi venas kaj diras al la kliento: "Viro, vi havas 37% neŭtrala", kaj li diras tion. , " Ŭaŭ! Mirinda!" Tial, estus pli interese movi iom pli: de taksado de sento ĝis taksado de la opinioj pri tio, kion ili diras pri via produkto.

Kaj ĉi tio ankaŭ estas tre interesa afero, ĉar... Mi persone kredas, ke principe ne povas esti neŭtralaj mesaĝoj, ĉar se iu skribas ion en publika spaco, tiu ĉi mesaĝo estas iel kolorigita. Mi persone neniam vidis neŭtralan mesaĝon menciantan markon. Kutime ĝi estas ia malpuraĵo.

Se ni prenas grandan nombron da ĉi tiuj mesaĝoj (povus esti milionoj, 10 milionoj), reliefigas la ĉefan ideon de ĉiu mesaĝo, kombinas ilin, ni povas kompreni sufiĉe fidinde, kion homoj diras pri ĉi tiu marko, kion ili pensas. "Mi ne ŝatas la pakaĵon", "Mi ne ŝatas la konsekvencon", ktp.

Kion opinias homoj pri Transaero, Chupa Chups kaj la Prezidanto de Usono?

Mi havas amuzan ekzemplon: ĉi tio estas infografio pri tio, kion farus uzantoj de sociaj retoj kun la kompanio Transaero post ĝia bankroto.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Estas multaj interesaj ekzemploj tie: bruligi, mortigi, deporti al Eŭropo, estis eĉ 2% kiuj skribis - "Sendu ilin al Sirio por militaj operacioj." Transirante de la amuza afero, ĝi povus esti preskaŭ ajna marko - de mia plej ŝatata hunda manĝaĵo ĝis kelkaj aŭtoj. Kiu ne ŝatas la pakaĵon, kiu ne ŝatas verajn aferojn - vi ĉiam povas labori kun ĉi tio, vi ĉiam povas konsideri ĉi tion. Estas granda nombro da ekzemploj, kiam homoj preskaŭ ŝanĝis la produktadon de siaj produktoj ĉar ili skribis en sociaj retoj, ke Chupa Chups ne estis sufiĉe ronda aŭ ĝi ne estis sufiĉe dolĉa.

Estas alia amuza ekzemplo. Divenu kiajn komentojn kaj pri kiu?

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Ial, nun la analizo de opinioj, la analizo de faktoj ĉerpitaj el mesaĝoj, estas ne tre uzata kaj ne tre disvastigita. Kvankam ĉi tiu teknologio ne estas supersekreta, en ĉi tio praktike tute ne estas scipovo, ĉar el la komentoj de homoj, ĉerpi la subjekton, predikaton kaj grupigi ilin ne postulas genion en komputila lingvistiko. Ne estas tiel malfacile fari. Sed mi esperas, ke en la venontaj du jaroj homoj komencos uzi ĉi tion, ĉar... Estos mojose - ĉi tio estas tia aŭtomata retrosciigo! Vi ĉiam scias, kion ili diras pri vi. Nu, vi komprenas, ke tio estis farita pri la usona prezidanto.

Respondo al demando de la publiko:

  • Jes, ĉi tio estas Facebook en la angla. Ili estas tradukitaj en la rusan ĉi tie. Ĉi tio estis skribita ie.

Big Data kaj politikaj teknologioj

Fakte, mi havas multajn malsamajn interesajn ekzemplojn de politiko pri Trump kaj ĉiuj aliaj, sed ni decidis ne alporti ilin ĉi tien. Sed estas unu politika ekzemplo.

Ĉi tiuj estas elektoj al la Ŝtata Dumao. Kiam vi estis? Pasintjare? Antaŭ preskaŭ jaro kaj duono.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Jen homoj, kiuj povis determini sian precizan lokon, ĝis certa geopunkto, por kompreni en kiun balotdistrikton ili falas. Kaj tiam el tiuj homoj estis prenitaj nur tiuj, kiuj esprimis sian difinitan opinion, por kiuj ili voĉdonus.

El la vidpunkto de politika teknologio, tio ne estas tre ĝusta, ĉar ĉi tiu tuta afero devas esti normaligita per loĝdenso ktp. Tamen, la bluusoj ĉi tie voĉdonos por vi scias kiu, la ruĝuloj voĉdonos por opoziciaj kamaradoj, el kiuj, cetere, ne estis multaj.

Mi persone kredas, ke Big Data ne baldaŭ atingos politikajn teknologiojn, sed, laŭvole, la kandidato ankaŭ estas marko. Kaj ĉi tio ankaŭ estas, iagrade, analizo de faktoj kaj opinioj pri via marko, kaj sufiĉe interesa afero, ĉar vi povas kompreni en reala tempo kiu faras kion. Mi konas plurajn kazojn de BBC, kiam ili monitoris sociajn retojn en reala tempo en iu elsendo: estis tia kaj tia respondo, homoj skribas pri ĝi, demandas tian demandon - kaj ĝi estas bonega! Mi pensas, ke ĝi estos uzata tre baldaŭ, ĉar ĝi estas interesa por ĉiuj.

Modeligado de markpozicioj

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Poste mi havas modeladon de markpozicioj. Malgranda, mallonga peco pri kiel vi povas rangigi markojn uzante diversajn metrikojn (ne ŝatojn de abonantoj en sociaj retoj, sed uzante kompleksajn metrikojn, intereson pri enhavo, tempon pasigitan ricevi metrikojn).

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Mi havas ekzemplon de "pharma" pro certa kialo. Ĉi tie la malgrandaj rondoj estas internaj, helaj - jen la kvanto da tekstenhavo, kiun la marko mem kreas, la granda cirklo estas la kvanto da foto kaj video enhavo kiun la marko mem kreas.

Proksimeco al la centro montras kiom interesa la enhavo estas por la publiko. Estas granda modelo, ekzistas amaso da ĉiaj parametroj: ŝatoj, repostaj, respondtempo, kiuj averaĝe kunhavis tie... Ĉi tie vi povas vidi: estas mirinda "Kagotsel", kiu pumpas grandegan kvanton da mono por krei sian propran enhavon, kaj pro tio ili estas sufiĉe proksimaj al la centro. Kaj estas kamaradoj, kiuj ankaŭ kreas propran enhavon, sed la publiko ne interesiĝas pri ĝi. Ĉi tio ne estas tre taŭga ekzemplo, ĉar ĉiuj ĉi tiuj kontoj estas preskaŭ mortaj.

Yegor Creed estas amata pli ol Basta

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Bedaŭrinde, la ceteraj... de kion montri... Nu, estas ankaŭ rusaj repistoj, laŭvole, de veraj kompanioj.

Kio estas la pluso? La fakto estas, ke kompanio povas meti preskaŭ ion ajn en tian modelon, komencante de la averaĝa salajro de abonantoj, kiuj laboras por via marko; ajna modelo, kiun ili ŝatas. Ĉar ĉiu reklam-agentejo kalkulas siajn proprajn metrikojn malsame, markoj kalkulas siajn proprajn metrikojn malsame.

Ankaŭ ĉi tie estas unu - Basta, kiu generas grandan kvanton da enhavo, sed situas ĉe la periferio, ĉar ĉi tiu enhavo ŝajne ne estas tre interesa por la publiko. Denove, mi ne supozas juĝi. Sed tamen ekzistas Yegor Creed, kiu, laŭ sociaj retoj, estas preskaŭ la plej bona interpretisto de nia tempo, sed publikigas nur siajn personajn fotojn. Tamen, li havas grandan nombron da abonantoj: estas ie ĉirkaŭ miliono da ili. Mi ne memoras la precizan nombron; Mi memoras, ke la procento de engaĝiĝo de ĉi tiuj homoj estas multe pli alta ol 85%, tio estas, por miliono da abonantoj li ricevas 850 mil respondojn de ĉi tiuj veraj homoj - tio estas vera frenezo. Ĉi tio estas vera.

Arthur Khachuyan: "Veraj Grandaj Datumoj en reklamado"

Respondoj al demandoj de la publiko:

Kiom da tempo daŭris por krei la repan analizmodelon?

  • Ĉiu havas sian celgrupon, la interesoj de ĉi tiuj homoj estas kalkulitaj por ĉiu... Ĉio ĉi estas normaligita al la distanco al la centro proksimume, ilia radiala pozicio ne gravas (ĉi tie simple ŝmiriĝas por beleco, por ke ili faru ne renkontu unu la alian). Gravas nur la proksimuma proksimeco al la centro. Ĉi tiu estas la modelo, kiun ni uzas. Ekzemple, mi pli ŝatas la cirklon, iuj homoj faras ĝin en menso kiel duoncirklo.
  • Ĉi tiu modelo estis kompilita rapide, en du aŭ tri horoj (jes, unu persono). Ĉi tie nur metrikoj estis enmetitaj: kion ni multobligas per kio, aldonas ĝin, kaj poste iel normaligu ĝin. Dependas de la modelo. Estas homoj, kiuj interesiĝas pri la averaĝa salajro (ĉi tio ne estas ŝerco) de siaj abonantoj. Kaj por tio vi devas trovi iliajn kontaktojn, Avito, kalkuli ĉion, multobligi ĝin. Okazas, ke tio bezonas multe da tempo por konsideri, sed specife ĉi tion (montras la antaŭan diapozitivon) - la parametroj ĉi tie estas tre simplaj: abonantoj, repostaj, ktp. Ĝi daŭris proksimume du-tri horojn por kompletigi. Sekve, ĉi tiu afero tiam estas ĝisdatigita en reala tempo, kaj vi povas uzi ĝin.

Nun venas la amuza parto. Mi finis kun ekzemploj, ĉar ne estas interese paroli dum longa tempo sole. Kaj mi esperas, ke vi nun faros demandojn, kaj ni, fakte, transiros de temo al temo, ĉar mi havas tiajn ekzemplojn pri kiel teknologioj povas esti uzataj ktp...

Respondoj al demandoj de la publiko:

  • Mi havis unu kaj nur personan kazon kun unu, por tiel diri, "preskaŭ-kazino", kiam fotilo estis metita tien, vizaĝoj estis rekonitaj, ktp. La procento de homoj agnoskitaj estas certe sufiĉe granda - kaj nia kaj niaj konkurantoj. Sed ĝi fakte estas sufiĉe interesa. Mi vidas ĉi tion kiel interesa afero: vi povas kompreni kiuj estas ĉi tiuj homoj kaj antaŭdiri sufiĉe bone kial ĝuste ili venis ĉi tien, kio ŝanĝiĝis en iliaj vivoj tiom multe ke ili decidis veni al la kazino. Sed pri specifaj specoj de komerco... Se vi metas tian aferon en apoteko, tiam ne utilas - vi ne povas antaŭdiri kial homo venis al la apoteko.

    La tutmonda tasko ĉi tie estis konstrui modelon por kompreni kiam homo eble volas interesiĝi pri via marko, por ke vi povu doni al li reklamadon ne post kiam li aĉetis ion (kiel okazas nun), sed doni al li reklamadon " en prognozo” de kiam ĉi tio ĉio okazos. Estis interese kun tia "preskaŭ-kazino"; montriĝis sufiĉe interesa procento de ĉi tiuj homoj - kial: iu subite ricevis reklamadon, iu alia ricevis ion alian - tiajn interesajn komprenojn. Sed kun kelkaj butikoj, kun podetala komerco, kun vendejo de iaj piloloj, ŝajnas al mi, ke ĝi ne estos tre ĝusta.

Ĉu Big Data estas uzata eksterrete?

  • Ĝi estis eksterrete. Vi nur bezonas kompreni precize, proksimume, ĉu ĉi tiu modelo taŭgas aŭ ne. Denove, kun ŝaŭmakvo... Mi fakte interesiĝas pri ĉio, sed mi persone ne komprenas kiom, kiel la profiloj de tiuj homoj, ilia konduto povas dependi de kiam ili volas aĉeti enbotelakvon. Kvankam ĉi tio vere povas esti vera, mi ne scias.

Kiom da malfermitaj kontoj pri sociaj amaskomunikiloj ekzistas?

  • Ni specife havas 11 sociajn retojn - ĉi tiuj estas "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagramo" kaj kelkaj malgrandaj aferoj (mi povas rigardi la liston, kiel "Mail.ru" kaj tiel plu) . En VKontakte ni certe havas kopion de ĉiuj ĉi kamaradoj. Ni havas homojn en VKontakte - tio estas 430 milionoj el ĉiuj, kiuj iam ekzistis (el kiuj ĉirkaŭ 200 milionoj estas konstante aktivaj); estas grupoj, estas ligoj inter ĉi tiuj homoj kaj estas enhavo, kiu interesas nin (teksto), kaj parto de la amaskomunikiloj, sed tre malgranda... Malglate, ni rigardas ĉi tiun bildon: se estas vizaĝoj tie, ni konservu ilin, se estas memeo, ni savas ilin Ni ne konservas ĝin, ĉar eĉ ni ne havus sufiĉe por konservi la amaskomunikilaron.

    Estas ruslingva Fejsbuko. Ie nun 60-80% estas Odnoklassniki, post kelkaj monatoj ni verŝajne atingos ilin ĉiujn ĝis la fino. Rusa Instagram. Por ĉiuj ĉi tiuj sociaj retoj estas grupoj, homoj, ligoj inter ili kaj teksto.

  • Ĉirkaŭ 400 milionoj da homoj. Estas subtileco: estas homoj, kies urbo ne estas specifita (ili estas eble rusaj / ne-rusaj); El tiuj, la mezumo por sociaj retoj estas 14% de fermitaj kontoj en VKontakte, mi ne scias la ĝustan ciferon en Fejsbuko.
  • Ni ankaŭ ne konservas amaskomunikilaron en Instagram - nur se estas vizaĝoj tie. Ni ne konservas tian (alian) amaskomunikilan enhavon. Kutime interese: nur teksto, ligoj inter homoj; Ĉiuj. La plej ofta esploro en Instagram estas la kutima esplorado pri la publiko: kiuj estas ĉi tiuj homoj, kaj, plej grave, la rilato de ĉi tiuj homoj kun aliaj sociaj retoj. Trovu la profilon de ĉi tiu persono en Vkontakte kaj Facebook por kalkuli lian aĝon kaj tiel plu.
  • Ankoraŭ ne necesas alfronti ĉiujn aliajn - simple ĉar ne estas klientoj. Pri la lingvo: ni havas rusan, anglan, hispanan, sed tamen ĉi tio estas uzata ekskluzive por markoj el Rusio; nu, aŭ la kompanioj, kiuj alportas ilin el Rusio.
  • Ni intervjuas homojn ĉiutage en multaj, multaj, multaj fadenoj: ni kolektas datumojn kolektante la retejon, kaj ĝisdatigas ĉi tiujn indikilojn per Api. En 2-3 tagoj vi povas trairi la tutan "VKontakte", trairante ilin; Post ĉirkaŭ unu semajno vi povas trarigardi la tuton de Facebook, komprenante kiu ĝisdatigis kion kaj kio ne. Kaj poste rekunigu ĉi tiujn homojn aparte: kio ĝuste ŝanĝiĝis, skribu ĉi tiun tutan historion. Tre malofte laŭ mia sperto la malnova profilo de socia amaskomunikilaro de iu estis uzata por iu reala komerca celo. Ĉi tiu estis la tempo, kiam unu politika figuro kandidatiĝis, kaj lia tasko estis kompreni, kiaj homoj venas al la sidejo, kiuj estas tiuj homoj antaŭ 6-8 monatoj (ĉu ili forigis sian profilon, sed fakte por alia kandidato alvenis balotoj). ruinigi).

    Kaj kelkfoje - personaj rakontoj kiam ies fotoj estis publikigitaj en la publika domeno. Necesis trovi konektojn ktp. Bedaŭrinde, estas domaĝe, sed ni ne povas atesti en tribunalo, ĉar nia datumbazo estas laŭleĝe nellikva.

  • MongoDB-stokado estas mia plej ŝatata.

Sociaj retoj provas batali datumkolektadon

  • Kutime ni alŝutas nur liston de ĉi tiuj kontoj al reklamantoj, kaj tiam ili uzas la norman... Tio estas, en sociaj retoj, en VKontakte, vi povas specifi liston de ĉi tiuj homoj.

    Sed Fejsbuko uzas aĉetitajn kuketojn. Ni mem ne laboras kun kuketoj, sed estis pluraj rakontoj, kiam la reklamanto mem donis kelkajn homojn, ni interagis kun ili - ili havas ĉi tiujn retojn, kun teaser, ne-tezera reklamado, ĉi tiujn "kuketojn". Vi povas ligi ĝin - sen demando! Sed mi ne tre ŝatas ĉi tiujn aferojn ĉar mi ne pensas, ke ĝi estas tre aŭtentika. Ĉi tio estas pure miaopinie, ĝi similas TNS, kiu "spuras" televidilojn - ne estas klare ĉu vi spektas ĉi tiun televidilon aŭ ne, ĉu vi lavas la telerojn dum via televidilo estas ŝaltita... Kaj ĉi tie estas same. : Mi tre ofte guglos ion en Interreto, sed tio ne signifas, ke mi volas aĉeti ĝin.

  • Se vi uzas ian norman kontekstan reklamreton: mi havis plurajn rakontojn kiam ni malŝarĝis ĉi tiujn homojn al ili kaj provis, uzante iliajn interfacojn, konekti ilin per "kuketoj" en iliaj retejoj. Sed mi ne tre ŝatas tiajn aferojn.

Formulo por kalkuli la salajron de interreta uzanto

  • La ĝenerala formulo por la averaĝa salajro: ĉi tiu estas la regiono kie homo loĝas, ĉi tiu estas la kategorio de komerco en kiu li laboras (tio estas, la firmao kiu estas lia dunganto), tiam lia pozicio en ĉi tiu firmao estas prenita, la mezumo. salajro por ĉi tiu posteno estas taksita... Meza salajro prenita de "Head Hunter" kaj "Superjob" (kaj estas pluraj aliaj fontoj) por donita vakantaĵo en difinita regiono kaj por donita komerca kunteksto.

    De "Avito" kaj "Avto.ru" pliaj parametroj estas kutime prenitaj se persono lumigis la telefonon. Kun Avito vi povas vidi kiajn aferojn homo vendas - multekosta, malmultekosta, uzata, ne uzata. Per "Avto.ru" vi povas vidi ĉu li havas aŭton - li posedas ĝin, li ne posedas ĝin. Ĉi tio estas ie malpli ol 20% de homoj, kiuj hazarde faligis sian telefonon ie, kaj ilia konto povas esti ligita kun ĉi tiuj datumoj.

Kiajn volumojn funkcias la kompanio de kolekto de datumoj?

  • La volumo de stokitaj fotoj en petabajtoj estas 6,4. Mi ne povas diri ĝuste la kreskorapidecon nun, ĉar en 2016 ni komencis registri "periskopojn" kaj ĵus komencis registri videon.

    Mi ne povas diri ĝuste kiam ĝi estis nulo. Ni transloĝiĝis de kompanio al kompanio - ĉi tiuj ĉiuj estas longaj rakontoj. Sed mi povas diri, ke VK, Facebook, Instagram kaj Twitter - ĉio ĉi tiu komerco (homoj, grupoj kaj ligoj inter ili) kun teksto kaj enhavo - ĉi tio fakte ne estas multaj datumoj, estas neverŝajne eĉ petabajto sufiĉas. Mi pensas, ke ĝi estas 700 gigabajtoj, verŝajne 800.

Ĉu vi helpas klientojn determini la nunan niĉon kaj kie fosi?

  • Kiam kliento venas, ni sugestas tiajn aferojn al li, sed ni mem, kiel Google Trends, ne faras tiajn aferojn.
  • Ni havis plurajn preskaŭ-sociologiajn rakontojn, kun balota, antaŭbalota historio - ni analizis ĉion. Kun markoj kaj taksado de opinioj pri markoj, ĉio preskaŭ ĉiam konsentas. Jen elekto-elektorakontoj - ne (kun takso pri kiu kandidato devas venki). Mi ne scias, kiu eraras ĉi tie - ni, aŭ tiuj, kiuj pensas en VTsIOM.
  • Kutime ni prenas tiujn kontrolrezultojn de la marko mem, ili prenas ĝin de kamaradoj kiuj mendas esploron - telefonan esploron, merkatan esploron ktp. Krome, ĉi tiu tuta afero estas kontrolita per bazaj aferoj: iu respondis al la dissendolisto, iu faris enketojn... Se temas pri granda marko (Koka-kolao, ekzemple), ili certe havas milionon aŭ du internajn recenzojn de klientoj. – ĉi tio ne estas nur komentoj pri sociaj retoj kaj kelkaj opinioj; Ĉi tiuj estas iaj internaj sistemoj, recenzoj, ktp.

La leĝo ne "scias" kio estas personaj datumoj!

  • Ni analizas ekskluzive malfermajn datumfontojn kaj neniam partoprenas en iuj malpuraj lertaĵoj. Nia modelo baziĝas sur la fakto, ke ni stokas ĉiujn malfermitajn datumojn en iuj publikaj datumcentroj, luas ĝin aliloke kaj analizas ĝin hejme, ĉe niaj oficejoj, en niaj serviloj, kaj ĝi ne iras ie ajn ekster la teritorio.

    Sed nia leĝaro en la kampo de malfermaj datumoj estas tre neklara.

    Ni ne havas klaran komprenon pri kio estas malfermitaj datumoj, kio estas personaj datumoj - ekzistas ĉi tiu 152-a Federacia Leĝo, sed tamen... Kiel ili kalkulas? Nun, se mi havas vian nomon kaj vian telefonnumeron en unu datumbazo, en alia datumbazo mi havas vian telefonnumeron kaj vian retpoŝton, en tria mi havas, ekzemple, vian retpoŝton kaj vian aŭton; Ĉio ĉi ŝajnas esti nepersonaj datumoj. Se vi kunmetas ĉion ĉi, ŝajnas, ke laŭ la leĝo ĝi fariĝos personaj datumoj.

    Ni ĉirkaŭiras ĉi tion en du manieroj. La unua estas instali servilon kun programaro por la kliento, kaj tiam ĉi tiuj datumoj ne preterpasas lian teritorion, kaj tiam la kliento respondecas pri la dissendo de ĉi tiuj personaj datumoj, nepersonaj datumoj, ktp. Aŭ la dua opcio: se ĉi tio estas ia rakonto, kie vi devas jurpersekuti socian reton aŭ ion alian...

    Ni havis tian studon kiam ni kolektis (estis Unuiĝinta Rusio-antaŭbalotoj) por Lifenews la kontojn de ĉi tiuj kamaradoj kaj rigardis kian pornaĵon ili ŝatas. Estis amuza afero, sed tamen. Ni vendas ĉi tion kiel nia propra, persona opinio, sen laŭleĝe malkaŝi en la dokumentoj tion, kion ni analizis - la Unuigita Ŝtata Registro de Juraj Entoj, salajroj, sociaj retoj; Ni vendas spertulan opinion, kaj poste flanke ni klarigas al la homo, kion ni analizis kaj kiel.
    Estis pluraj rakontoj, sed ili rilatis al kelkaj publikaj komercaj projektoj. Ekzemple, ni havas senpagan neprofitan projekton por tiuj, kiuj veturas longtabulojn (tiaj tabuloj estas longaj): la tasko estis kolekti publikaĵojn de homoj - kiam iu afiŝas "Mi iris al Gorkij Parko por veturi." Kaj nun li devus eniri la mapon, kaj homoj ĉirkaŭ li povas vidi ke iu estas proksime de li. VK kunkaptis nin pri ĉi tiu temo dum tre longa tempo, ĉar ili ne ŝatis la fakton, ke ni publikigas ĉi tiujn informojn sen la permeso de homoj. Sed tiam la afero ne venis al tribunalo, ĉar ene de pluraj grandaj komunumoj ni aldonis al la reguloj, ke la datumoj povus esti uzataj de triaj, agentejoj, kompanioj, analizoj, ktp. Kompreneble, ĝi ne estis aparte etika, sed tamen.

  • Ni ĵus rimarkis ĝin ĝustatempe kaj komencis vendi nian spertan opinion al ĉiuj.

Ĉu vi laboras kun edukaj institucioj?

  • Ni kunlaboras kun edukaj institucioj, jes. Ni havas tutan gamon: ni havas majstran programon ĉe la Supera Lernejo, kaj ni kunlaboras kun aliaj universitatoj. Ni tre amas universitatojn!
  • Se vi havas miajn kontaktojn, vi povas skribi al mi. Kaj ligilo al la prezento, se iu interesiĝas - ĉiuj ĉi ekzemploj estas tie, vi povas movi ĝin.
  • Se vi konas la telefonnumeron, poŝton - ĉi tio estas preskaŭ centprocenta opcio, neniu forigos ĝin. Se ne ekzistas telefonnumero, ĝi estas kutime bildo; se ne estas bildo, ĝi estas la jaro, loĝloko, laboro. Tio estas, laŭ jaro, loĝloko kaj laboro, preskaŭ ĉiuj povas esti identigitaj sufiĉe subtile. Sed ĉi tio, denove, estas demando pri la tasko.

    Ni havas, ekzemple, klienton, kiu vendas interretan televidon. Iu aĉetis de ili abonon al ĉi tiuj "Ludoj de Tronoj", kaj la tasko estas uzi sian CRM por trovi ĉi tiujn homojn en sociaj retoj, kaj poste trovi eblajn el ilia areo de influo. Mi nur volas diri, ke ili havas, ekzemple, antaŭnomon, familian nomon kaj retmesaĝon... Kaj tiam estas tre malfacile fari ion ajn. Plejofte oni povas trovi homojn per retpoŝto.

  • Surbaze de la konsisto de niaj amikoj, ni kutime "kongruas" homojn en sociaj retoj, sed ĉi tio ne ĉiam ĝustas. Ne estas, ke ĝi ne ĉiam pravas - ĝi ne ĉiam funkcias. Unue, tio postulas multan laboron, ĉar ĉi tiu operacio (kongruaj homoj) devos unue esti farita por ĉiu el la amikoj - por kompreni ĉu ili venis el sociaj retoj aŭ ne. Kaj tiam - nekonata fakto al iu ajn, ke ĉe VKontakte ni havas la samajn amikojn, ĉe Fejsbuko ni havas malsamajn amikojn. Ne por ĉiuj, sed por mi, ekzemple, estas tiel; kaj ĉi tio validas ankaŭ por plej multaj homoj.

Kiel la plej kompletaj datumoj estas kolektitaj?

  • Instalante programaron por la kliento siaflanke. Sur ili estas instalita servilo, kiu prenas de ni nur publikajn datumojn kaj prilaboras iliajn personajn datumojn interne. NDA estas finita kun la kliento. Ĉi tio, kompreneble, ne estas tre ĝusta, ke ili transdonas ĉi tion al ni, sed laŭleĝa respondeco apartenas al la kliento - nu, tio estas, instali programaron por li aŭ transdoni anonimajn datumojn. Sed tio estis tre malofta, ĉar - ĝusta aŭ malĝusta anonimigo - plejofte perdiĝas la dependeco inter tiuj homoj.

Kiu Aĉetas Vizaĝan Rekonan Programaron?

  • Ni efektive iras ĉi tien ĉar nia ĉefa programaro, kiun ni vendas, estas vizaĝa serĉo, korelacia analizo, kaj ni vendas ĝin al registaraj agentejoj. Kaj antaŭ jaro kaj duono, ni decidis, ke ni metos ĉiujn ĉi tiujn rakontojn en reklamadon, en merkatadon, en la publikan merkaton - jen kiel Social Data Hub, komerca jura ento, formiĝis. Kaj nun ni ĵus venas ĉi tien. Ni pendigas ĉi tie jam de jaro kaj duono, provante klarigi al homoj, ke ne necesas doni al homoj elŝutojn kun mencio, ke oni devas doni al ili respondojn al demandoj, ke ne necesas tonaleco. , kaj tiel plu. Do estas malfacile diri kie...
  • (Kiun vi volas diri?) Al ĉiuj kamaradoj, kiuj bezonas serĉi teroristojn kaj pederastojn.
    Mi povas tuj diri (tio estos la sekva demando): laŭ niaj datumoj, neniuj instruistoj estis malliberigitaj pro repostado.
  • En VKontakte - 14%; en Fejsbuko ne ekzistas fermita profilo kiel tia (estas fermita listo de amikoj, ktp). Kaj la plej interesa afero estas, ke mi ĵus skribis mesaĝon - nun ili kalkulos kaj diros.

Ne afiŝu ion pri kio vi hontos!

  • Ne afiŝu ion ajn en sociaj retoj, kio hontigus vin - mi persone sekvas ĉi tion. Kvankam mi havis multajn personajn, ĉar mi ĵuras en Fejsbuko. Nu, estis kaj estis io farenda... Ne afiŝu ion ajn, kio estus embarasa! Se vi poste laboros ie en la Publika Ĉambro, jes, estas pli bone ne komenti. Se vi ne faros ĉi tion, ĝenerale, neniu zorgas. Mi povas nur certigi vin, ke neniu legas vian personan korespondadon, kaj ĉio ĉi konstruas ĉi tiun tutan historion...

    Ĉiusemajne, iu certe venas al mi kaj diras: "Nu, la fotoj de mia amiko estis likitaj al iu anonima publika paĝo! Helpu! Cetere, neniam publikigu ion ajn al anonimaj publikaj paĝoj.

  • Pri aliaj monitoraj sistemoj mi ne scias - tion ni nepre konsideros, ke la mencio de la marko estis negativa, Dio pardonu min... Sed mi povas diri, ke ĉiaj preskaŭ-ŝtataj kamaradoj interesiĝas nur pri homoj. kiuj havas publikon de pli ol 5 mil, kaj ilia publika opinio povas influi iun.tiam influi. Laŭ mia sperto, neniam okazis, ke la HR-agentejo, kiu ordigas de ni profilajn taksojn, diris: "Kiu ŝatas Navalny, ne dungu iun ajn!"

Pri publikigado de la rezultoj. Kiom da homoj estas dungitaj en esplorado?

  • El la plej bonaj 10 reklamaj kompanioj, sep nun eldonas. Estas malfacile diri: kiam ni komencis ĉi tion antaŭ jaro kaj duono... Ni havas plurajn homojn en ĉiu areo - estas pluraj homoj en bankoj, estas pluraj homoj en HR, estas pluraj homoj en reklamado. Kaj nun ni pensas pri kiu estas pli enspeziga iri unue, por kiu ni devas komenci fari iujn interfacojn...
  • (pri la nombro da homoj per merkatsegmento) Ne pli ol 25 homoj, ĉar ni seksperfortis neniun.
  • Ĝenerale, principe, ĉi tiuj teknologioj de la merkato estas uzataj, mi pensas, je pli ol 50%. Iuj en reklamaj kampanjoj, iuj en ia interna analizo. Mi dirus, ke 40 procentoj uzas ĝin en interna analizo, 50-60% vendas ĝin por fini markojn. Sed tio jam dependas de la reklamaj kompanioj mem. Vi vidas, iuj raportas simple pri la elspezita mono, la reklamado, kiun ili metis, dum aliaj skribas pri kiom da homoj ili alportis, kian publikon... Mi dirus tiel, sed mi povus erari - mi ne faras. Mi vere imagas, kiel ĉiuj tiuj kamaradoj funkcias. Mi scias nur en kvantaj datumoj.

Kelkaj reklamoj 🙂

Dankon pro restado ĉe ni. Ĉu vi ŝatas niajn artikolojn? Ĉu vi volas vidi pli interesan enhavon? Subtenu nin farante mendon aŭ rekomendante al amikoj, nuba VPS por programistoj de $4.99, unika analogo de enirnivelaj serviloj, kiu estis inventita de ni por vi: La tuta vero pri VPS (KVM) E5-2697 v3 (6 Kernoj) 10GB DDR4 480GB SSD 1Gbps de $ 19 aŭ kiel dividi servilon? (havebla kun RAID1 kaj RAID10, ĝis 24 kernoj kaj ĝis 40GB DDR4).

Dell R730xd 2 fojojn pli malmultekosta en Equinix Tier IV datumcentro en Amsterdamo? Nur ĉi tie 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 televidilo ekde 199 USD en Nederlando! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - ekde $99! Legu pri Kiel konstrui infrastrukturan korpon. klaso kun la uzo de serviloj Dell R730xd E5-2650 v4 valorantaj 9000 eŭrojn por centono?

fonto: www.habr.com

Aldoni komenton