Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Ing 14 Maret 2017, Arthur Khachuyan, CEO Hub Data Sosial, ngandika ing kuliah BBDO. Arthur ngomong babagan pemantauan cerdas, mbangun model prilaku, ngenali konten foto lan video, uga alat lan riset Social Data Hub liyane sing ngidini sampeyan target pamirsa nggunakake jaringan sosial lan teknologi Big Data.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Arthur Khachuyan (sabanjuré - AH): - Halo! Halo kabeh! Jenengku Arthur Khachuyan, aku mbukak perusahaan Social Data Hub, lan kita melu macem-macem analisis intelektual sing menarik saka sumber data mbukak, lapangan informasi lan nindakake kabeh riset menarik lan liya-liyane.

Lan dina iki kolega saka BBDO Group takon kita kanggo pirembagan bab teknologi modern kanggo nganalisa data amba, data amba lan ora amba kanggo iklan: carane digunakake, nuduhake sawetara conto menarik. Muga-muga sampeyan bakal takon ing dalan, amarga aku bisa bosen lan ora mbukak inti lan liya-liyane, mula aja isin.

Bener, arah utama, ing ngendi sawetara solusi "near-big-data" digunakake," kabeh wis jelas - iki minangka target pamirsa, analisis, nganakake riset pemasaran analitis. Nanging tansah menarik apa data tambahan sing bisa ditemokake, apa makna tambahan sing bisa ditemokake sawise nglamar analisis.

Napa kita butuh teknologi kanggo pariwara?

Ngendi kita miwiti? Sing paling jelas yaiku pariwara ing jaringan sosial. Dina iki aku njupuk ing wayah esuk: sakperangan alesan VKontakte mikir aku kudu ndeleng iklan tartamtu iki ... Apa iku apik utawa ala iku pitakonan kapindho. Kita weruh manawa aku mesthi kalebu ing kategori wajib militer:

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Wangsulan: Bab ingkang pisanan lan paling menarik sing bisa dijupuk minangka solusi teknologi ... Wangsulan: Bab ingkang pisanan aku wanted kanggo mutusake sadurunge kita miwiti kanggo nemtokake istilah: apa data mbukak lan apa data amba? Amarga kabeh wong duwe pangerten dhewe babagan perkara iki, lan aku ora pengin ngetrapake syarat-syaratku marang sapa wae, nanging ... Mung supaya ora ana bedho.

Secara pribadi, aku mikir yen mbukak data iku kabeh sing bisa dakgayuh tanpa mlebu utawa sandhi. Iki profil mbukak ing jaringan sosial, iki asil panelusuran, iki mbukak registri, etc. Big data, ing pangerten dhewe, aku weruh kaya iki: yen piring data, iku milyar baris, yen sawetara jenis. saka panyimpenan file, iku nang endi wae petabyte data. Liyane ing terminologiku ora data gedhe, nanging kaya ngono.

Profiling tliti dhuwur lan skor profil

Ayo budhal. Babagan sing paling pisanan lan paling menarik sing bisa ditindakake saka nganalisa sumber data mbukak yaiku profil presisi dhuwur lan skor profil. Apa iki? Iki minangka crita ing ngendi akun jaringan sosial sampeyan bisa prédhiksi ora mung sapa sampeyan, ora mung kapentingan sampeyan.

Nanging saiki, kanthi nggabungake macem-macem sumber, sampeyan bisa ngerti tingkat rata-rata gaji, pinten biaya apartemen, lan ing ngendi papan kasebut. Lan kabeh data iki bisa digunakake kanthi harfiah saka sarana sing kasedhiya. Contone, yen sampeyan njupuk akun ing jaringan sosial, katon, ngomong, ngendi sampeyan manggon, ngendi sampeyan bisa; ngerti apa bagean bisnis perusahaan sampeyan kerja; download lowongan padha saka HH lan "Superjob" yen ana Analyst, manager, etc.; Deleng ing ngendi sampeyan manggon (basis, ngomong CIAN), ngerti carane akeh biaya nyewa omah ing panggonan iki, carane akeh iku kanggo tuku omah ing panggonan iki, prédhiksi kira-kira pinten sampeyan entuk. Salajengipun, nggunakake jaringan sosial, sampeyan bisa ngerti carane lelungan, ngendi sampeyan, lan setya marang majikan.

Mulane, saka jumlah metrik sing akeh banget, kita bisa nindakake apa wae sing dikarepake. Kita bisa ngenalake produk sing sampeyan minati. Apa sampeyan bisa mbayangno toko online? Sampeyan lunga menyang kana - toko online iki nyekel akun sampeyan ing jaringan sosial lan ngandhani: "Masha, sampeyan lagi wae putus karo pacar, ana sawetara produk tartamtu kanggo sampeyan." Iki dudu mangsa ngarep...

Kepiye geolokasi wong ditemtokake?

Jawaban kanggo pitakonan saka pamirsa:

  • Biasane, 80% kabeh check-in dianggep minangka panggonan sing tepat. Nanging kanggo wong sing ora mriksa ing ngendi wae, ana sawetara opsi: salah siji check-in, utawa geolocation, utawa iki analisis kiriman lan publikasi kanggo kabeh periode wektu nalika wong nulis soko ... Lan nang endi wae, ana sing bakal muncul kaya "Aku pengin tuku stroller cedhak Akademicheskaya" utawa "Aku bubar ndeleng graffiti sing ala ing tembok kene." Tegese, meh 80% wong, geolokasi, papan kerja lan papan panggonane bisa ditemtokake nggunakake data utawa metadata sing bisa dikumpulake saka jaringan sosial.

    Iki, maneh, minangka analisis kiriman. Ing pangertèn sing paling gampang, iki minangka analisis check-in lan geolokasi ing jaringan sosial, sing ora mbusak metadata jpeg (sampeyan bisa ngerteni apa wae). Nanging kanggo wong-wong sing isih ana, iki biasane siaran teks: salah siji wong "sumorot" lokasi nalika nulis babagan, utawa dheweke "sumorot" telpon, sing sampeyan bisa nemokake sawetara iklan ing Avito utawa akun ing " Auto RU". Adhedhasar data iki, sampeyan bisa gabungke (contone, "Aku sade mobil near Mayakovskaya") lan kira-kira nganggep iki.

  • Biasane wong ngirim iki ing media sosial. Kita mung nggarap sumber terbuka lan ing kene kita ngomong babagan sumber terbuka. Biasane nerbitake pariwara, yaiku, ing sewidak persen kasus, crita sing paling umum nalika wong "nuduhake" nomer ponsel saiki yaiku iklan kanggo adol barang. Ing sawetara klompok ana wong nulis ("Aku ngedol iki utawa sing ana"), utawa menyang endi wae.

    ya wis! Biasane dheweke komentar kaya: "Jawab utawa kirim SMS, telpon nomerku. Iki kerep banget kedaden kanggo wong sing ngedol soko, tuku soko ing jaringan sosial, komunikasi karo wong... Mulane, nggunakake nomer iki sampeyan banjur bisa link profil ing CIAN kanggo, yen wis tau nerbitaké soko, utawa , maneh, ing Avito. Iki mung sing paling populer, sumber ndhuwur, bakal luwih maju - yaiku Avito, CIAN lan liya-liyane.

  • Iki nuduhake toko online. Sabanjure bakal dadi teknologi pangenalan rai lan pencocokan profil (kita bakal ngomong babagan iki). Secara teoritis, iki bisa ditrapake ing toko offline. Lan umume, impen gedheku yaiku nalika spanduk jalanan katon, nalika sampeyan mlaku liwat kamera, "jebakan" pasuryan sampeyan. Nanging kasus iki bakal dilarang dening hukum amarga nglanggar privasi. Aku ngarep-arep bakal kelakon cepet utawa mengko.
  • Saka pengalaman pribadi. Kerep banget, nalika wong nulis soko kanggo sampeyan, sampeyan operate ing sawetara kanyatan saka urip sing ngirim ora koyone ngerti ... Wong ing paling kasus njaluk wedi. Nanging! Adhedhasar statistik anyar, jumlah akun sing ditutup ing jaringan sosial wis suda 14%. Jumlah palsu tambah akeh, jumlah akun sing mbukak - wong saya maju menyang keterbukaan. Aku mikir yen ing 3-4 taun, dheweke bakal mandheg reaksi banget babagan kasunyatan manawa ana wong sing ngerti informasi babagan dheweke sing ora bisa dingerteni. Nanging nyatane gampang banget kanggo ndeleng temboke.

Apa sing bisa dijupuk saka sumber terbuka?

Ana dhaptar kira-kira bab sing bisa dimangerteni kanthi linuwih sing cukup dhuwur saka sumber terbuka. Nyatane, ana metrik sing luwih beda; iku gumantung ing customer riset kuwi. Ana sawetara agensi HR sing kasengsem apa sampeyan sumpah ing jaringan sosial utawa ing papan umum. Ana sing kasengsem apa sampeyan seneng karo publikasi Navalny utawa, sebaliknya, publikasi United Russia, utawa sawetara jinis konten porno - kedadeyan kaya ngono asring kedadeyan.

Sing utama yaiku nilai kulawarga, perkiraan biaya apartemen, omah, nggoleki mobil, lan liya-liyane. Adhedhasar iki, wong bisa dipérang dadi kelompok sosial. Iki pangguna Moscow Tinder, sing padha (miturut gambar sing ditemokaké ing akun Facebook); adhedhasar kapentingane, dheweke dipérang dadi macem-macem kelompok sosial:

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Yen luwih cedhak karo pariwara, mula kita wis alon-alon ngalih saka penargetan pariwara standar, nalika sampeyan milih ing VKontakte sing kasengsem karo wong lanang umur 18 taun sing langganan klompok tartamtu. Aku duwe gambar iki sabanjure, aku bakal nuduhake sampeyan saiki:

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Ing ngisor iki yaiku umume layanan saiki sing nganalisa, ing prinsip, wong sing nganalisa jaringan sosial, melu nganalisa kapentingan ... Bab pisanan sing ana ing pikirane wong yaiku nganalisa klompok ndhuwur pelanggan. Mbok iki bisa kanggo sawetara, nanging aku wong iku dhasar salah. Kenging punapa?

Suka sampeyan diklumpukake lan dianalisis

Saiki njupuk telpon, deleng grup paling dhuwur sampeyan - mesthi bakal ana luwih saka 50% grup sing wis dilalekake, iki minangka konten sing ora cocog karo sampeyan. Sampeyan ora ngonsumsi kabeh, nanging sistem bakal nglacak sampeyan miturut wong-wong mau: yen sampeyan wis langganan resep-resep, kanggo sawetara grup populer. Yaiku, sampeyan bakal nglanggar sistem sing nganalisa profil sampeyan, lan kapentingan sampeyan ora bakal dibenerake.

Moving on... Ana apa? Kita nganggep apa sing ditindakake wong liya. Ing mratelakake panemume, cara sing paling nyukupi kanggo netepake kapentingan pangguna yaiku seneng. Contone, ing VKontakte ora ana feed sing seneng, lan wong mikir yen ora ana sing ngerti apa sing disenengi. Ya, sawetara sing seneng dikenalake ing Instagram, kita ndeleng soko ing Facebook, nanging umume konten ing klompok tartamtu ora nyebarake iki ing feed umum, lan wong urip lan mikir yen ora ana sing ngerti apa sing disenengi.

Lan kanthi ngumpulake konten tartamtu saka sawetara jinis sing menarik kanggo kita, ngumpulake kiriman kasebut, ngumpulake sing disenengi, banjur mriksa wong iki nggunakake database iki, kita bisa nemtokake kanthi akurasi sing dhuwur, sapa dheweke, apa nasibe, apa sing dikarepake. Selehake dheweke ing grup sosial tartamtu lan sesambungan karo dheweke.

Tuku mobil ngganti prilaku

Aku duwe conto kaya ngono. Aku bakal langsung nggawe reservasi yen contoku cedhak-iklan lan cedhak-marketing, amarga, sampeyan ngerti, umume kasus dilindhungi dening NDA lan liya-liyane. Nanging isih bakal ana akeh perkara sing menarik. Dadi, crita karo wong-wong iki: iki wong sing tuku mobil antarane 2010 lan 2015. Kepiye prilaku sosial online wis diganti dituduhake kanthi warna. Persentase bocah-bocah wadon ing antarane pelanggan wis diganti, aku langganan kaca umum "boyish", nemokake pasangan seksual permanen ...

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Kabeh iki dipérang miturut merek mobil lan jumlah wong. Saka kene sampeyan bisa narik akeh kesimpulan sing menarik babagan prilaku wong lan cara kerjane. Aku bisa ngomong sing Porsche Cayenne lan Priora nandur meh podho rupo saka jumlah pamirsa kepincut. Kualitas pamirsa lan prilaku kasebut beda-beda, nanging jumlahe kira-kira padha. Kesimpulan sing bisa digambar saka kene yaiku apa wae sing dikarepake, luwih cedhak karo pasar sampeyan. Yen sampeyan adol Audi, sampeyan nggawe slogan "Tuku Audi lan lunga saka wong tuwa!" lan liya-liyane.

Ya, iki minangka conto sing lucu babagan prilaku wong adhedhasar analisis sing disenengi, adhedhasar klompok sing dipindhah, konten apa sing dianalisis - kanthi kemungkinan meh 100% nggawe jelas sapa sampeyan. Amarga yen sampeyan ora duwe akses menyang lalu lintas jaringan lan ora maca pesen pribadi, seneng bakal tansah pitutur marang kowe sapa wong iki - wong wadon ngandhut, ibu, wong militèr, polisi. Lan kanggo sampeyan, minangka wong sing bisa ngiklanake, iki minangka target gedhe.

Jawaban kanggo pitakonan saka pamirsa:

  • Saben kolom minangka jumlah wong ing mobil iki; carane pola prilaku wis diganti. Deleng: wong sing tuku Porsche Cayenne - kira-kira 550 wong (kuning), persentase bocah-bocah wadon ing antarane pelanggan saya tambah.
  • Sampel kasebut yaiku pangguna jaringan sosial "Vkontakte", "Facebook", "Instagram" saka 2010 nganti 2015. Siji-sijine klarifikasi: mobil sing dipilih ing kene yaiku sing bisa dingerteni ing foto kanthi akurasi luwih saka 80% nggunakake alat tartamtu.
  • Sajrone wektu tartamtu, mobil (yaiku, dudu dheweke, kita ninggalake menyang jaringan sosial) ... Sajrone wektu tartamtu, ana wong sing terus-terusan difoto nganggo mobil, ana karo publikasi kasebut. beda-beda, foto-foto saka sudut sing beda-beda, lan liya-liyane. Banjur bakal ana gambar sing njupuk gambar karo mobil lan ... Ya, iki minangka pitakonan kapindho - kepercayaan ing data jaringan sosial.
  • Awit kita ngunggahake, sayangé, data media sosial ora mesthi bener. Wong ora tansah kepekso kanggo nerbitaké informasi. Secara pribadi, aku nindakake panaliten kasebut: Aku mbandhingake jumlah lulusan universitas Moskow karo jumlah wong sing didaftar ing jaringan sosial. Rata-rata, 60% luwih akeh wong sing kadhaptar ing jaringan sosial - lulusan Universitas Negeri Moskow ing taun tartamtu ing spesialisasi tartamtu - tinimbang sing ana ing prinsip. Dadi ya - mesthi ana persentase kesalahan ing kene, lan ora ana sing ndhelikake. Ing kene kita mung njupuk mobil sing bisa diidentifikasi kanthi kemungkinan luwih saka 80%.

Dhaptar sumber kanggo latihan model

Ing ngisor iki minangka dhaptar conto sumber sing bisa digunakake, sing digunakake kanggo nemtokake kanthi pasti profil sosial wong, sapa dheweke.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Kita njupuk profil saka jaringan sosial, saka CIAN - biaya apartemen kira-kira, "Head-Hunter", "Superjob" - iki gaji rata-rata kanggo wong tartamtu. Muga-muga ora ana wakil Kepala Pamburu ing kene, amarga dheweke mikir yen ora apik banget kanggo njupuk data kasebut saka dheweke. Nanging, iki minangka gaji rata-rata ing wilayah tartamtu kanggo jinis kegiatan tartamtu kanggo lowongan.

"Avito", "Avto.ru": asring banget wong, nalika telpon padhang, mesthi duwe (ing nomer akeh kasus) ing paling soko ing "Avito", utawa ing "Avto.ru", utawa ing sawetara situs liyane sing sampeyan bisa ngerti sapa dheweke. Yen kereta dorong utawa mobil didol ing nomer telpon iki ... Rosstat lan Register Negara Serikat Badan Hukum isih luwih akeh ndhaptar kanthi bantuan sampeyan bisa menehi peringkat perusahaan sing makarya - miturut sawetara rumus, miturut model sing sembarang wong bisa nyetel (sampeyan kira-kira bisa nemtokake dhuwit wong iki etc.).

Tinder mbantu ngumpulake data babagan kahanan wong

Kajaba iku, ana sing menarik (utawa, lucu banget ing sinau) - iki, maneh, koleksi data saka Moscow Tinder nggunakake bot kanggo Tinder iki. Jarak menyang wong ditemtokake, banjur lokasi kira-kira ditemtokake.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Tujuan saka panliten iki yaiku kanggo nemtokake jumlah akun Tinder ing wilayah institusi pemerintah - ing Duma, kantor jaksa, lan liya-liyane. Nanging sampeyan, minangka pengiklan, bisa mbayangno apa wae sing dikarepake: bisa uga, contone, Starbucks utawa wong liya ... Yaiku, jumlah wong ing Tinder sing ngombe kopi saka sampeyan, pesen apa wae, ana ing toko. Babagan geolokasi iki: iki bisa ditindakake kanthi layanan apa wae.

Wangsulan pitakon saka pamirsa:

  • Tinder? Sampeyan ora ngerti? Tinder minangka aplikasi kencan ing ngendi sampeyan ndeleng foto (kiwa-tengen), lan aplikasi iki nuduhake jarak menyang wong kasebut. Yen sampeyan entuk jarak menyang wong iki saka telung titik sing beda, sampeyan bisa nemtokake lokasi kasebut kira-kira (+ 5-7 meter). Ing kasus iki, kanggo netepake ing wilayah kantor jaksa utawa Duma Negara, iku ora dadi angel. Nanging maneh, bisa dadi toko sampeyan, bisa uga apa wae.

Contone, suwene suwe, kita duwe kasus kaya ngono (dudu sinau), nalika nampa saka salah sawijining operator seluler data babagan Kapadhetan lalu lintas, data babagan Kapadhetan gerakan titik seluler, lan kabeh informasi kasebut ditumpangi. ing koordinat papan reklame sing ana ing dalan gedhe. Lan tugas operator seluler yaiku nemtokake kira-kira jumlah wong sing liwat lan bisa ndeleng iklan papan reklame iki.

Yen ana spesialis pariwara papan reklame ing kene, sampeyan bisa ngomong: ora bisa dimangerteni kanthi super-reliabilitas - ana sing teka, ana sing ora katon, ana sing ndeleng ... Nanging, iki minangka conto kepiye ana 20 milyar poligon. iki ing Moscow, kang Kapadhetan saka wong-wong iki ing saben jam ing rute tartamtu... Sampeyan bisa ndeleng apa wong-wong iki liwat ing sembarang wayahe lan kira-kira ngira aliran penumpang.

Wangsulan pitakon saka pamirsa:

  • Ora ana sing menehi data kaya ngono. Kita nganakake panaliten kasebut kanggo salah sawijining operator, iki minangka crita internal eksklusif, dadi, sayangé, ora ditampilake ing gambar. Nanging asring agensi pariwara gedhe ora duwe masalah ngubungi operator. Paling ora ing Moskow, ana akeh precedents nalika, contone, perusahaan asuransi nguripake kanggo perusahaan kaya GetTaxi, sing nyedhiyani data impersonal babagan umur driver, carane drive (apik - ala, sembrono - ora), kanggo prédhiksi. kawicaksanan lan liya-liyane. Saben uwong berjuang karo iki, nanging ing sawetara tingkat internal, menehi data anonim - Aku ora ana sing duwe masalah kuwi.

Pangenalan Gambar lan Pola

Terusna. Favoritku yaiku pangenalan gambar. Bakal ana potongan cilik babagan nggoleki wong kanthi rai, nanging biasane ora njupuk bagian iki. Kita njupuk pangenalan gambar khusus lan nemtokake apa sing ana ing gambar iki - nggawe mobil, werna, lan liya-liyane.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Aku duwe conto lucu iki:

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Ana sinau babagan nggoleki tato ing macem-macem jaringan sosial. Mulane, padha bisa ditrapake kanggo merek apa wae, kanggo gambar visual, meh kabeh gambar visual. Ana sing ora bisa ditemtokake kanthi andal (kita ora njupuk).

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Iki favoritku. merek mobil cukup kerep nguripake kanggo tugas iki amarga tugas, contone, kanggo nemokake kabeh pemilik saka sawetara BMW X6, ngerti sing padha, carane padha disambungake kanggo saben liyane, apa padha kasengsem ing, lan ing. Iki ana hubungane karo pitakonan apa mobil sing dijupuk wong ing jaringan sosial.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Ora ana nyaring ing kene babar pisan: obyek iku duweke, mobil dudu duweke; Iku mung risak saka mobil - umur lan ing. Nanging pangenalan gambar visual asring digunakake: iki minangka panelusuran kanggo wanita ngandhut, lan panelusuran logo merek ing sawetara media massa (sing ngirim apa).

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Kasus favorit (sing digunakake dening macem-macem restoran): apa jenis gulungan sing dikirim ing jaringan sosial. Iku lucu, nanging nyatane ngidini sampeyan ngerti akeh perkara sing menarik, sepisanan, babagan pelanggan sampeyan dhewe: sing teka lan ngapa dheweke nindakake. Amarga ora rahasia manawa ing bar sushi, umume wong (aku ora bakal ngomong "cah wadon") njupuk gambar kanggo mriksa, njupuk foto, lsp.

Merek bisa njupuk kauntungan saka iki. Merek kasebut kasengsem karo produk apa sing dibutuhake kanggo motret lan ngirim kanthi apik, apa jenis wong sing teka ing kana. Bab iki bisa ditindakake kanthi meh kabeh, saka panganan.

Pangenalan pola video

Wangsulan pitakon saka pamirsa:

  • Ora ing video. Kita duwe ing mode test. Kita nyoba teknologi iki, nanging ternyata ... Iku ngenali kabeh karo video cukup apik, nanging kita wis ora nemu aplikasi kanggo ngendi wae. Bye. Loro saka nganalisa carane akeh lan video bloggers ngomong nang endi wae ... Ana sinau kuwi. Pira raine ketemu, sepira kerepe. Nanging merek durung ngerti ngendi arep teka karo iki. Mbok menawa ing sawijining dina bakal teka.

Maneh, iki panganan, bisa dadi wanita ngandhut, wong lanang (ora ngandhut), mobil - apa wae.

Minangka pilihan, ana sinau Taun Anyar kanggo siji media. Uga adoh saka iklan, nanging isih. Mangkene panganan sing ditindakake wong pasa ing Taun Anyar:

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Iku uga bejat mudhun dening umur kene. Sampeyan bisa ndeleng korélasi kaya sing wong enom biasane pesen panganan, wong diwasa biasane nggawe meja tradisional. Iku bab sing lucu, nanging mbayangno minangka pemilik merek, sampeyan bisa ngevaluasi akeh perkara: sing nangani produk sampeyan lan carane, apa sing ditulis babagan. Asring, wong ora tansah nyebutake merek kasebut ing teks kasebut, lan sistem pemantauan analitis tradisional ora bisa tansah mangerteni lan nemokake sebutan merek kasebut mung amarga ora kasebut ing teks kasebut. Utawa teks kasebut salah ejaan, ora ana tag hash utawa apa wae.

Foto-foto kasebut katon. Kanthi fotografi, sampeyan bisa ngerti yen iku subyek tengah pigura utawa dudu subyek tengah pigura. Banjur sampeyan bisa ndeleng apa sing ditulis wong iki. Nanging sing paling kerep digunakake kanggo nggoleki pamirsa potensial sing wis nyopir mobil tartamtu lan liya-liyane. Banjur kita bakal nindakake akeh perkara sing menarik karo mobil kasebut.

Bot diajari niru manungsa

Ana uga pilihan kanggo nggunakake wong ngetang:

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Ana pilihan kanggo mbandhingaké wong, nalika sampeyan kudu golek wong nggunakake sawetara foto, ngerti profil sosial, sing lagi. Maneh, kita bali menyang pitakonan yen kita duwe kamera ing toko offline, mula iki cara sing cukup apik kanggo ngerti sapa sing nekani sampeyan, sapa wong-wong iki, apa sing dikarepake, apa sing nyebabake dheweke teka menyang sampeyan. .

Sabanjure teka sing paling menarik: yen kita ngumpulake akun ing jaringan sosial, ngerti sapa wong-wong iki, apa sing dikarepake, kita bisa (minangka pilihan) nggawe bot sing padha karo wong-wong iki; bot iki bakal miwiti urip kaya wong-wong iki lan nganalisa iklan apa sing katon ing macem-macem jaringan sosial. Iki bakal ngidini sampeyan ngerti kanthi tepat merek sing ditargetake kanggo wong iki. Iki uga crita sing cukup umum nalika sampeyan ora mung kudu nganalisa sapa wong iki lan apa kapentingane, nanging uga jenis iklan sing kudu ditargetake pesaing potensial utawa wong liya sing kasengsem.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Analisis sambungan ing jaringan sosial

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Bab sing menarik sabanjure yaiku analisis hubungan antarane wong. Bener, analisis sambungan ing jaringan, grafik jaringan kasebut - ora ana sing anyar, ora ana sing anyar, kabeh wong ngerti iki.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Nanging aplikasi kanggo tugas iklan paling menarik. Iki minangka panelusuran kanggo wong sing nyetel tren, iki minangka panelusuran kanggo wong sing nyebarake informasi miturut kriteria tartamtu ing jaringan iki. Ayo dadi kasengsem ing pemilik padha model BMW tartamtu. Kanthi nggabungake kabeh, kita bisa nemokake wong sing ngontrol opini publik. Iki ora mesthi blogger otomotif lan liya-liyane. Biasane iki kanca-kanca prasaja sing njagong ing macem-macem kaca umum, kasengsem ing sawetara konten lan bisa, ing wektu sing cendhak banget, narik kawigaten merek utawa wong sing sampeyan minati menyang area tanggung jawab iki, menyang wilayah ​kapentingan.

Ana conto kaya ing kene. We duwe sawetara wong potensial, sambungan antarane wong. Ing kene sing oranye iku wong, titik-titik cilik iku kelompok umum, kanca umum.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Yen sampeyan ngumpulake kabeh sambungan iki antarane wong-wong mau, sampeyan bisa ndeleng kanthi jelas yen ana wong sing duwe akeh klompok umum, kanca umum, ana ing antarane awake dhewe ... Lan yen visualisasi sing padha iki dipérang dadi klompok kanthi kapentingan, dening isi, kang disebaraké, carane akeh padha sesambungan karo saben liyane... Kene sampeyan bisa ndeleng sing gambar sadurungé dadi kaya iki:

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Ing kene klompok kasebut dibedakake kanthi jelas kanthi warna. Ing kasus iki, iki minangka siswa master ing Sekolah Tinggi Ekonomi. Ing kene sampeyan bisa ndeleng manawa sing wungu/biru iku sing seneng karo kaca umum Transparency International, Open Russia, lan Khodorkovsky. Ngisor kiwa ana sing ijo, sing seneng United Russia.

Sampeyan bisa ndeleng manawa gambar sadurunge kaya iki (iki mung sambungan antarane wong), nanging wis dadi demarkasi sing jelas. Tegese, kabeh wong tansah gegandhèngan karo siji lan sijiné, padha-padha kapentingan, padha kekancan. Ana sawetara ing ndhuwur, liyane ing ngisor, lan sawetara kanca liyane ana. Lan yen saben subgraphs cilik iki kapisah visualized karo paramèter liyane lan katon ing kacepetan panyebaran isi (kira-kira ngandika, sing reposts apa ana), sampeyan bisa nemokake ing saben bagean siji utawa loro wong sing tansah nyekel pendapat umum ing tangan. sesambungan karo kang, takon ngirim sawetara jenis kirim utawa mergo - sampeyan bisa njaluk respon saka kabeh iki pirsawan menarik.

Aku duwe conto liyane. Uga grafik: iki minangka karyawan BBDO Group sing ditemokake ing jaringan sosial minangka conto. Iku katon ora menarik, gedhe, ijo, sambungan antarane ...

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Nanging aku duwe pilihan ing ngendi klompok wis dibangun ing antarane. Banjur, yen ana sing kasengsem, ana versi interaktif - sampeyan bisa ngeklik lan ndeleng.

Ndhuwur tengen ana sing tresna marang Putin. Ing kene sing ungu yaiku perancang; sing kasengsem ing desain, soko menarik, lan liya-liyane. Ing kene sing putih yaiku tim manajemen (ketoke, aku ngerti); Iki minangka wong sing, ing umum, ora disambungake kanthi cara apa wae, nanging bisa kerja ing posisi sing padha. Liyane iku kelompok umum, sambungan, lan liya-liyane.

Merek ora butuh blogger, nanging pimpinan opini

Kita njupuk wong-wong iki lan nemokake - banjur agensi iklan, perusahaan iklan mutusake dhewe: bisa menehi dhuwit kanggo wong iki supaya bisa sesambungan karo konten iki, liya-liyane, utawa ngarahake kampanye iklan khusus kanggo dheweke. Iki uga kerep digunakake, utamane saiki, amarga kabeh merek pengin nggarap blogger, dheweke pengin isine dipromosikan, nanging agensi iklan ora pengin ngubungi (uga, iki kedadeyan).

Lan cara nyata metu saka kahanan iki kanggo nemokake wong sing dudu blogger, dudu blogger kecantikan, nanging contone, sawetara makhluk nyata sing sesambungan karo merek iki, sing bisa nulis ing sawetara kaca umum "Mail.ru Answers", njaluk nomer tartamtu saka views. Wong-wong iki, sing terus-terusan kasengsem ing isi wong iki, bakal nyebar kabeh, lan merek bakal entuk keterlibatan.

Pilihan kapindho kanggo nggunakake teknologi kasebut saiki cukup relevan - nggoleki bot, favoritku. Iki minangka risiko reputasi kanggo pesaing sampeyan, lan kesempatan kanggo ngilangi wong sing ora relevan saka kampanye iklan, lan liya-liyane (mbusak komentar, lan nggoleki sambungan antarane wong). Aku duwe conto kuwi, iku uga gedhe lan interaktif - sampeyan bisa mindhah. Iki minangka sambungan saka wong sing nulis komentar ing komunitas Lentach.

Conto iki supaya sampeyan ngerti carane bot sing apik lan gampang katon; lan iki sampeyan ora perlu duwe kawruh technical. Iki tegese "Lentach" nerbitake kiriman babagan penyelidikan FBK babagan Dmitry Medvedev, lan wong-wong tartamtu wiwit nulis komentar. Kita ngumpulake kabeh wong sing nulis komentar - wong iki ijo. Saiki aku bakal pindhah:

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Wong-wong iku sing ijo (sing nulis komentar). Padha kene, padha kene. Titik biru ing antarane yaiku klompok umume, titik kuning minangka pelanggan umum, kanca, lan liya-liyane. Akeh wong sing disambungake karo saben liyane. Amarga, apa wae teori jabat tangan telu, papat, lima, kabeh wong disambungake ing jaringan sosial. Ora ana wong sing pisah saka siji liyane. Malah kanca-kanca phobia sosial sing nggunakake VKontakte khusus kanggo nonton video isih langganan sawetara kaca umum sing padha karo kita.

Navalny uga nggunakake bot. Saben uwong duwe bot

Sebagéyan gedhé wong (ing kene, ing kene) sing disambungake. Nanging ana klompok cilik saka comrades sing kanca istimewa karo saben liyane. Lha wong cilik-cilik ijo, kene kanca-kancane lan rombongane. Dheweke malah tiba ing kene:

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Lan kanthi kebetulan, wong-wong iki sing nulis ing postingan iki: "Navalny ora duwe bukti" lan liya-liyane, nulis komentar sing padha. Mesthi, aku ora wani nggawe kesimpulan. Nanging, aku duwe postingan liyane ing Facebook, nalika ana debat antarane Lebedev lan Navalny, aku nganalisa komentar kasebut kanthi cara sing padha: ternyata kabeh wong sing nulis "Lebedev iku telek", dheweke ora ana ing sosial. jaringan bubar patang sasi, ora langganan ing samubarang kaca umum, dumadakan menyang kirim tartamtu iki, wrote komentar iki pas lan ninggalake. Maneh, ora bisa nggawe kesimpulan saka kene, nanging ana wong saka tim Navalny nulis komentar yen dheweke ora nggunakake bot. Inggih, oke!

Luwih cedhak karo iklan, luwih cedhak karo merek. Kabeh duwe bot saiki! Kita duwe, pesaing kita duwe, lan liyane duwe. Dheweke kudu dibuwang utawa ditinggal supaya bisa urip kanthi becik; Adhedhasar data kasebut (nuduhake slide sadurunge), nggawa menyang kesempurnaan supaya katon kaya wong nyata lan mung banjur digunakake. Senajan nggunakake bot iku ala! Nanging, crita sing cukup umum ...

Ing mode otomatis, bab kuwi ngijini sampeyan kanggo nyaring metu saka analisis wong sing ora ana hubungane karo analisis, wong sing ora kudu kalebu ing sampel, ngirim ora kalebu ing panaliten iki. Asring banget digunakake. Banjur maneh, ora kabeh sing duwe mobil pancen duwe mobil. Kadhangkala wong mung kasengsem ing wong sing duweni potensi duwe mobil, sing njagong ing sawetara klompok, komunikasi karo wong, ana pamirsa tartamtu.

Analisis fakta lan panemu

Sabanjure aku uga dadi favoritku. Iki minangka analisis fakta lan panemu.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Saiki kabeh wong ngerti carane nyebutake merek ing macem-macem sumber. Ora ana rahasia babagan iki. Lan saben wong katon bisa ngetung tonality ... Senajan kanthi pribadi, aku mikir yen metrik tonality dhewe ora menarik banget, amarga nalika sampeyan teka lan ngandhani klien, "Man, sampeyan duwe 37% netral," lan ngandika mangkono , “Wah! Keren!" Mulane, bakal luwih menarik kanggo mindhah luwih dhisik: saka ngevaluasi sentimen kanggo netepake panemu babagan apa sing diomongake babagan produk sampeyan.

Lan iki uga minangka bab sing menarik banget, amarga ... Aku pribadi percaya yen ing prinsip ora ana pesen netral, amarga yen ana wong nulis soko ing ruang publik, pesen iki diwarnai kanthi cara apa wae. Aku dhewe ora tau ndeleng pesen netral sing nyebutake merek. Biasane iku sawetara jinis rereget.

Yen kita njupuk akeh pesen kasebut (bisa uga ana mayuta-yuta, 10 yuta), nyorot gagasan utama saka saben pesen, gabungke, kita bisa ngerti cukup andal apa sing diomongake wong babagan merek iki, apa sing dikira. "Aku ora seneng kemasan," "Aku ora seneng konsistensi," lan liya-liyane.

Apa wong mikir babagan Transaero, Chupa Chups lan Presiden Amerika Serikat?

Aku duwe conto lucu: iki minangka infographic babagan apa sing bakal ditindakake pangguna jaringan sosial karo perusahaan Transaero sawise bangkrut.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Ana akeh conto sing menarik ing kana: ngobong, mateni, deportasi menyang Eropa, malah ana 2% sing nulis - "Kirim menyang Suriah kanggo operasi militer." Ngalih saka sing lucu, bisa uga meh kabeh merek - saka panganan asu favorit nganti sawetara mobil. Sapa sing ora seneng karo kemasan, sapa sing ora seneng karo barang-barang nyata - sampeyan bisa nindakake iki, sampeyan bisa tansah njupuk iki. Ana akeh conto nalika wong meh ngganti produksi produk amarga dheweke nulis ing jaringan sosial yen Chupa Chups ora cukup bunder utawa ora cukup manis.

Ana conto lucu liyane. Coba tebak apa komentar lan babagan sapa?

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Kanggo sawetara alasan, saiki analisis panemu, analisis fakta sing diekstrak saka pesen, ora digunakake banget lan ora nyebar banget. Senajan teknologi iki ora super rahasia, ana prakteke ora ngerti-carane ing kabeh, amarga saka komentar wong, extracting subyek, predikat lan klompok mau ora mbutuhake genius ing linguistik komputasi. Ora angel ditindakake. Nanging aku ngarep-arep yen ing sawetara taun sabanjure wong bakal miwiti nggunakake iki, amarga ... Iku bakal kelangan - iki minangka umpan balik otomatis! Sampeyan mesthi ngerti apa sing diomongake babagan sampeyan. Ya, sampeyan ngerti manawa iki digawe babagan Presiden AS.

Wangsulan pitakon saka pamirsa:

  • Ya, iki Facebook ing basa Inggris. Padha diterjemahake menyang Rusia ing kene. Iki ditulis nang endi wae.

Big Data lan teknologi politik

Nyatane, aku duwe macem-macem conto politik sing menarik babagan Trump lan wong liya, nanging kita mutusake ora nggawa menyang kene. Nanging ana siji conto politik.

Iki minangka pemilihan kanggo Duma Negara. Nalika sampeyan? taun kepungkur? Meh setaun setengah kepungkur.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Ing ngisor iki ana wong sing bisa nemtokake lokasi sing tepat, nganti titik geo tartamtu, supaya bisa ngerti wilayah pemilihan sing padha. Banjur saka wong-wong iki mung wong-wong sing mratelakake panemume sing ditemtokake, sing bakal dipilih.

Saka sudut pandang teknologi politik, iki ora bener banget, amarga kabeh iki kudu dinormalisasi kanthi kapadhetan populasi lan liya-liyane. Nanging, blues ing kene bakal milih sampeyan ngerti sapa, sing abang bakal milih kanca oposisi, sing ora akeh.

Aku pribadi percaya yen Big Data ora bakal tekan teknologi politik kapan wae, nanging, minangka pilihan, calon kasebut uga dadi merek. Lan iki uga, nganti sawetara, analisa fakta lan panemu babagan merek sampeyan, lan bab sing rada menarik, amarga sampeyan bisa ngerti kanthi nyata sapa sing nindakake apa. Aku ngerti sawetara kasus saka BBC, nalika dheweke ngawasi jaringan sosial ing wektu nyata ing sawetara siaran: ana respon kaya ngono, wong nulis babagan iki, takon pitakon kasebut - lan apik banget! Aku mikir bakal digunakake banget, amarga iku menarik kanggo kabeh wong.

Posisi merek modeling

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Sabanjure aku duwe modeling posisi merek. Potongan cilik lan cendhak babagan carane sampeyan bisa peringkat merek nggunakake macem-macem metrik (ora seneng pelanggan ing jaringan sosial, nanging nggunakake metrik rumit, kapentingan ing isi, wektu sing digunakake kanggo nampa metrik).

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Aku duwe conto "pharma" kanggo alesan tartamtu. Ing kene bunderan cilik internal, padhang - iki jumlah isi teks sing digawe merek dhewe, bunder gedhe yaiku jumlah konten foto lan video sing digawe merek dhewe.

Cedhak karo tengah nuduhake carane menarik isi kanggo pamirsa. Ana model gedhe, ana macem-macem parameter: seneng, repost, wektu nanggepi, sing nuduhake rata-rata ing kono ... Ing kene sampeyan bisa ndeleng: ana "Kagotsel" sing apik banget, sing ngompa jumlah gedhe. dhuwit menyang nggawe isi dhewe, lan amarga iki padha cukup cedhak tengah. Lan ana kanca sing uga nggawe konten dhewe, nanging pamirsa ora kasengsem. Iki dudu conto sing cukup, amarga kabeh akun kasebut meh mati.

Yegor Creed ditresnani luwih saka Basta

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Sayange, liyane ... saka apa sing bakal ditampilake ... Inggih, ana uga rapper Rusia, minangka pilihan, saka perusahaan nyata.

Apa plus? Kasunyatane manawa perusahaan bisa nyelehake meh kabeh model kasebut, wiwit saka gaji rata-rata pelanggan sing kerja kanggo merek sampeyan; model apa wae sing disenengi. Amarga saben agensi iklan ngetung metrik dhewe kanthi beda, merek ngetung metrik dhewe kanthi beda.

Ana uga siji ing kene - Basta, sing ngasilake konten sing akeh, nanging dumunung ing pinggiran, amarga isi iki ketoke ora menarik banget kanggo pamirsa. Maneh, aku ora nganggep kanggo ngadili. Nanging, ana Yegor Creed, sing, miturut jaringan sosial, meh dadi pemain paling apik ing wektu kita, nanging mung nerbitake foto pribadine. Nanging, dheweke duwe akeh pelanggan: ana ing endi wae udakara sejuta. Aku ora ngelingi nomer pas; Aku elinga yen persentase keterlibatan wong-wong iki luwih dhuwur tinimbang 85%, yaiku, saben yuta pelanggan dheweke nampa 850 ewu tanggapan saka wong-wong nyata iki - iki kegilaan nyata. Iki bener.

Arthur Khachuyan: "Data Gedhe Nyata ing Iklan"

Jawaban kanggo pitakonan saka pamirsa:

Suwene suwene nggawe model analisis rapper?

  • Saben duwe target pamirsa dhewe, kapentingan wong-wong iki diwilang kanggo saben ... Kabeh iki dinormalisasi kanggo jarak menyang tengah kira-kira, posisi radial sing ora penting (iku mung smeared kene kanggo kaendahan, supaya padha nindakake. ora saling melu). Mung jarak kira-kira menyang tengah sing penting. Iki model sing kita gunakake. Contone, aku luwih seneng bunder, sawetara wong nindakake ing atine minangka setengah bunderan.
  • Model iki disusun kanthi cepet, sajrone rong utawa telung jam (ya, siji wong). Ing kene mung metrik sing dilebokake: apa sing kita tambahake, tambahake, banjur normalake. Gumantung ing model. Ana wong sing kasengsem ing gaji rata-rata (iki ora guyon) saka pelanggan. Lan kanggo iki, sampeyan kudu nemokake kontak, Avito, ngetung kabeh, multiply. Kedadeyan iki mbutuhake wektu sing suwe, nanging khusus iki (nuduhake slide sadurunge) - paramèter ing kene gampang banget: pelanggan, repost, lan liya-liyane. Kira-kira rong nganti telung jam rampung. Patut, bab iki banjur dianyari ing wektu nyata, lan sampeyan bisa nggunakake.

Saiki teka bagean fun. Aku wis rampung karo conto, amarga iku ora menarik kanggo ngomong kanggo dangu piyambak. Lan muga-muga sampeyan saiki bakal takon, lan kita bakal, nyatane, pindhah saka topik menyang topik, amarga aku duwe conto babagan carane teknologi bisa digunakake lan liya-liyane ...

Jawaban kanggo pitakonan saka pamirsa:

  • Aku duwe siji lan mung kasus pribadi karo siji, ngandika, "cedhak-kasino", nalika kamera diselehake ana, pasuryan dikenali, lan ing. Persentase wong sing diakoni mesthi cukup gedhe - kita lan pesaing kita. Nanging nyatane cukup menarik. Aku ndeleng iki minangka bab menarik: sampeyan bisa ngerti sing wong-wong iki lan prédhiksi cukup uga kok padha teka kene, apa wis diganti ing urip dadi luwih sing padha mutusaké kanggo teka casino. Nanging kanggo jinis bisnis tartamtu ... Yen sampeyan nyelehake barang kasebut ing apotek, mula ora ana gunane - sampeyan ora bisa prédhiksi kenapa ana wong teka ing apotek.

    Tugas global ing kene yaiku kanggo mbangun model supaya bisa ngerti kapan wong duweni potensi pengin kasengsem ing merek sampeyan, supaya sampeyan bisa menehi iklan ora sawise tuku barang (kaya sing kedadeyan saiki), nanging menehi iklan " ing ramalan" kapan iki kabeh bakal kelakon. Iku menarik karo kuwi "cedhak-casino"; ternyata ana persentase sing cukup menarik saka wong-wong iki - kok: ana sing tiba-tiba nampa promosi, wong liya entuk liyane - wawasan sing menarik. Nanging karo sawetara toko, karo eceran, karo toko saka sawetara jinis pil, misale jek kula sing ora bakal bener.

Apa Big Data digunakake offline?

  • Iku offline. Sampeyan mung kudu ngerti persis, kira-kira, apa model iki pas utawa ora. Maneh, karo banyu kemerlap... Aku pancene kasengsem ing kabeh, nanging aku pribadi ora ngerti carane akeh, carane profil wong-wong mau, prilaku bisa gumantung nalika arep tuku banyu botol. Senajan iki bisa uga bener, aku ora ngerti.

Pira akun media sosial sing mbukak?

  • Kita khusus duwe 11 jaringan sosial - yaiku "Vkontakte", "Facebook", "Twitter", "Odnoklassniki", "Instagram" lan sawetara perkara cilik (aku bisa ndeleng dhaptar, kayata "Mail.ru" lan liya-liyane) . Ing VKontakte, kita mesthi duwe salinan kabeh kanca kasebut. Kita duwe wong ing VKontakte - yaiku 430 yuta wong sing wis tau ana (sing udakara 200 yuta terus aktif); ana kelompok, ana sesambungan antarane wong-wong iki lan ana konten sing narik kawigaten kita (teks), lan bagean saka media, nanging cilik banget ... Kanthi kasar, kita ndeleng gambar iki: yen ana pasuryan, kita nyimpen wong, yen ana meme, kita nyimpen wong-wong mau. Kita ora nyimpen, amarga malah kita ora bakal cukup kanggo nyimpen isi media.

    Ana Facebook sing nganggo basa Rusia. Nang endi wae saiki 60-80% yaiku Odnoklassniki, ing sawetara wulan, kita bakal entuk kabeh nganti pungkasan. Instagram Rusia. Kanggo kabeh jaringan sosial iki ana klompok, wong, sambungan antarane wong-wong mau lan teks.

  • Udakara 400 yuta wong. Ana subtlety: ana wong sing kutha ora ditemtokake (padha duweni potensi Rusia / non-Rusia); Saka jumlah kasebut, rata-rata kanggo jaringan sosial yaiku 14% saka akun sing ditutup ing VKontakte, aku ora ngerti angka sing tepat ing Facebook.
  • Kita uga ora nyimpen media ing Instagram - mung yen ana pasuryan. Kita ora nyimpen konten media kasebut (liyane). Biasane menarik: mung teks, sambungan antarane wong; Kabeh. Riset sing paling umum ing Instagram yaiku riset umum babagan pamirsa: sapa wong-wong iki, lan, sing paling penting, hubungane wong kasebut karo jaringan sosial liyane. Temokake profil wong iki ing Vkontakte lan Facebook kanggo ngetung umure lan liya-liyane.
  • Ora perlu njupuk wong liya - mung amarga ora ana pelanggan. Babagan basa: kita duwe Rusia, Inggris, Spanyol, nanging isih digunakake khusus kanggo merek saka Rusia; uga, utawa perusahaan sing nggawa saka Rusia.
  • Kita wawancara wong saben dina ing akeh, akeh, akeh utas: kita ngumpulake data kanthi ngumpulake web, lan nganyari indikator kasebut nggunakake Api. Ing 2-3 dina sampeyan bisa ngliwati kabeh "VKontakte", ngliwati wong-wong mau; Kira-kira seminggu sampeyan bisa mbukak kabeh Facebook, ngerti sapa sing wis nganyari apa lan apa sing durung. Banjur ngumpulake maneh wong-wong iki kanthi kapisah: apa sing wis diganti, tulisake kabeh crita iki. Arang banget ing pengalamanku duwe profil media sosial lawas sing digunakake kanggo tujuan bisnis sing nyata. Iki minangka wektu nalika salah sawijining tokoh politik nglamar, lan tugase kanggo ngerti apa jenis wong sing teka ing markas, sapa wong-wong iki 6-8 sasi kepungkur (apa dheweke mbusak profil, nanging nyatane kanggo calon liyane, surat suara teka. ngrusak).

    Lan kaping pindho - crita pribadi nalika foto wong diterbitake ing domain umum. Sampeyan perlu kanggo golek sambungan, etc. Sayange, iku tega, nanging kita ora bisa menehi kesaksian ing pengadilan, amarga database kita sah illiquid.

  • Panyimpenan MongoDB minangka favoritku.

Jaringan sosial nyoba nglawan pengumpulan data

  • Biasane, kita mung ngunggah dhaptar akun kasebut menyang pengiklan, lan banjur nggunakake standar ... Yaiku, ing jaringan sosial, ing VKontakte, sampeyan bisa nemtokake dhaptar wong kasebut.

    Nanging Facebook nggunakake cookie sing dituku. Kita dhewe ora nggarap cookie, nanging ana sawetara crita nalika pengiklan dhewe menehi sawetara wong, kita sesambungan karo wong-wong mau - padha duwe jaringan kasebut, kanthi iklan teaser, non-teaser, "cookies" iki. Sampeyan bisa dasi - ora ana pitakonan! Nanging aku ora seneng karo barang-barang iki amarga aku rumangsa ora asli. Iki mung miturut pendapatku, kaya TNS, sing "nglacak" TV - ora jelas apa sampeyan nonton TV iki utawa ora, apa sampeyan lagi ngumbah piring nalika TV sampeyan urip ... Lan ing kene padha. : Aku kerep banget google soko ing Internet, nanging ora ateges aku pengin tuku.

  • Yen sampeyan nggunakake sawetara jinis jaringan iklan kontekstual standar: Aku duwe sawetara crita nalika kita unloaded wong-wong mau kanggo wong-wong mau lan nyoba, nggunakake antarmuka, kanggo nyambungake karo "cookies" ing situs. Nanging aku ora seneng karo sing kaya ngono.

Formula kanggo ngitung gaji pangguna Internet

  • Rumus umum kanggo gaji rata-rata: iki wilayah ngendi wong urip, iki kategori bisnis kang digunakake (yaiku, perusahaan sing dadi majikane), banjur posisi ing perusahaan iki dijupuk, rata-rata. gaji kanggo posisi iki kira-kira ... Gaji rata-rata dijupuk saka "Head Hunter" lan "Superjob" (lan ana sawetara sumber liyane) kanggo lowongan tartamtu ing wilayah tartamtu lan kanggo konteks bisnis tartamtu.

    Saka "Avito" lan "Avto.ru" paramèter tambahan biasane dijupuk yen wong wis madhangi telpon. Kanthi Avito sampeyan bisa ndeleng barang apa sing didol wong - larang, murah, digunakake, ora digunakake. Kanthi "Avto.ru" sampeyan bisa ndeleng manawa dheweke duwe mobil - dheweke duwe, dheweke ora duwe. Iki ana ing endi wae kurang saka 20% wong sing ora sengaja nyelehake telpon ing endi wae, lan akun kasebut bisa disambung karo data iki.

Apa volume perusahaan pangumpulan data beroperasi?

  • Volume foto sing disimpen ing petabyte yaiku 6,4. Aku ora bisa ngomong persis tingkat wutah saiki, amarga ing 2016 kita miwiti ngrekam "periskop" lan mung miwiti ngrekam video.

    Aku ora bisa ngomong persis nalika iku nul. Kita pindhah saka perusahaan menyang perusahaan - iki kabeh crita sing dawa. Nanging aku bisa ujar manawa VK, Facebook, Instagram lan Twitter - kabeh bisnis iki (wong, klompok lan sambungan ing antarane) kanthi teks lan konten - iki sejatine ora akeh data, mesthine malah petabyte entuk cukup. Aku iki 700 gigabyte, mbokmenawa 800.

Apa sampeyan mbantu klien nemtokake ceruk saiki lan ing ngendi arep digali?

  • Nalika klien teka, kita menehi saran marang dheweke, nanging kita dhewe, kaya Google Trends, ora nindakake perkara kasebut.
  • Kita duwe sawetara crita sing cedhak karo sosiologis, kanthi riwayat pemilihan, sadurunge pemilihan - kita nganalisa kabeh. Kanthi merek lan ngevaluasi panemu babagan merek, kabeh meh mesthi setuju. Iki crita-crita pemilihan-pemilihan - ora (karo penilaian calon sing kudu menang). Aku ora ngerti sing salah kene - kita, utawa sing mikir ing VTsIOM.
  • Biasane kita njupuk asil kontrol iki saka merek dhewe, padha njupuk saka comrades sing pesen riset - riset telpon, riset marketing, lan ing. Kajaba iku, kabeh iki bisa dicenthang kanthi dhasar: ana sing mangsuli mailing list, ana sing nggawe survey ... Yen merek gedhe (Coca-Cola, contone), mesthi duwe sejuta utawa rong review internal saka pelanggan. - iki ora mung komentar ing jaringan sosial lan sawetara panemu; Iki minangka sawetara jinis sistem internal, review, lan liya-liyane.

Hukum ora "ngerti" apa data pribadhi!

  • Kita nganalisa sumber data sing mbukak lan ora nate melu trik kotor. Model kita dibangun kanthi nyatane yen kita nyimpen kabeh data sing mbukak ing sawetara pusat data umum, nyewa ing papan liya, lan nganalisa ing omah, ing kantor, ing server, lan ora menyang ngendi wae ing njaba wilayah kasebut.

    Nanging undang-undang kita ing bidang data mbukak samar-samar.

    Kita ora duwe pangerten sing jelas babagan apa data sing mbukak, data pribadhi apa - ana Hukum Federal 152 iki, nanging isih ... Kepiye carane ngetung? Saiki, yen aku duwe jeneng lan nomer telpon ing database siji, ing database liyane aku duwe nomer telpon lan e-mail, ing katelu aku duwe, ngomong, e-mail lan mobil; Kabeh iki misale jek data non-pribadi. Yen sampeyan nggabungake kabeh iki, misale jek miturut hukum bakal dadi data pribadhi.

    Kita ngubengi iki kanthi rong cara. Kapisan yaiku nginstal server kanthi piranti lunak kanggo klien, banjur data iki ora ngluwihi wilayahe, banjur klien tanggung jawab kanggo distribusi data pribadhi iki, data non-pribadi, lan liya-liyane. Utawa pilihan kaloro: yen iki minangka sawetara crita sing sampeyan kudu nuntut jaringan sosial utawa liya-liyane ...

    Kita duwe sinau kaya nalika kita ngumpulake (ana United Russia primaries) kanggo Lifenews akun kanca-kanca iki lan ndeleng apa jenis saru padha disenengi. Iku bab lucu, nanging isih. We ngedol iki minangka kita dhewe, mratelakake panemume pribadhi, tanpa sah disclosing ing dokumen apa kita analisa - Negara Unified Register Entitas Hukum, gaji, jaringan sosial; We ngedol pendapat pakar, lan banjur ing sela-sela kita nerangake kanggo wong apa kita analisa lan carane.
    Ana sawetara crita, nanging ana hubungane karo sawetara proyek komersial umum. Contone, kita duwe proyek nirlaba gratis kanggo wong-wong sing numpak longboard (papan kuwi dawa): tugas kanggo ngumpulake publikasi wong - nalika ana wong sing ngirim "Aku lunga menyang Taman Gorky kanggo numpak." Lan saiki dheweke kudu mlebu ing peta, lan wong-wong ing saubengé bisa ndeleng manawa ana wong sing cedhak karo dheweke. VK nggandhengake kita babagan topik iki kanggo wektu sing suwe, amarga dheweke ora seneng yen kita nerbitake informasi kasebut tanpa ijin wong. Nanging banjur prakara kasebut ora teka ing pengadilan, amarga ing sawetara komunitas gedhe kita nambahake aturan manawa data kasebut bisa digunakake dening pihak katelu, agensi, perusahaan, analisis, lan liya-liyane.

  • Kita mung nyadari wektu kasebut lan wiwit adol pendapat pakar kanggo kabeh wong.

Apa sampeyan kerja karo institusi pendidikan?

  • Kita kerja sama karo institusi pendidikan, ya. Kita duwe macem-macem: kita duwe program master ing Sekolah Tinggi, lan kita kerja sama karo universitas liyane. Kita tresna banget marang universitas!
  • Yen sampeyan duwe kontak, sampeyan bisa nulis menyang aku. Lan link menyang presentation, yen ana sing kasengsem - kabeh conto iki ana, sampeyan bisa mindhah.
  • Yen sampeyan ngerti nomer telpon, mail - iki meh satus persen pilihan, ora ana sing bakal mbusak. Yen ora ana nomer telpon, biasane gambar, yen ora ana gambar, iku taun, panggonan panggonan, proyek. Sing, dening taun, panggonan panggonan lan karya, meh saben wong bisa dikenali cukup subtly. Nanging iki, maneh, pitakonan babagan tugas.

    Kita duwe, umpamane, klien sing adol televisi Internet. Ana sing tuku langganan "Games of Thrones" iki saka wong-wong mau, lan tugase nggunakake CRM kanggo nemokake wong-wong kasebut ing jaringan sosial, banjur golek potensial saka wilayah pengaruhe. Aku mung ateges sing padha duwe, ngomong, jeneng ngarep, jeneng mburi lan e-mail ... Lan banjur iku banget angel kanggo nindakake apa-apa. Ing sawetara kasus, wong bisa ditemokake liwat e-mail.

  • Adhedhasar komposisi kanca, kita biasane "cocog" wong ing jaringan sosial, nanging iki ora mesthi bener. Iku ora sing ora tansah bener - iku ora tansah bisa. Kaping pisanan, iki mbutuhake tenaga kerja sing akeh, amarga operasi iki (wong sing cocog) kudu ditindakake dhisik kanggo saben kanca - kanggo ngerti manawa dheweke teka saka jaringan sosial utawa ora. Banjur - kasunyatan sing ora dingerteni kanggo sapa wae yen ing VKontakte kita duwe kanca sing padha, ing Facebook kita duwe kanca sing beda. Ora kanggo kabeh, nanging kanggo kula, contone, kaya iki; lan iki uga bener kanggo umume wong.

Kepiye data sing paling lengkap diklumpukake?

  • Nginstal piranti lunak kanggo klien ing sisih. Server wis diinstal ing wong-wong mau, sing mung njupuk data umum saka kita, lan ngolah data pribadhi sacara internal. NDA rampung karo klien. Iki, mesthi, ora banget bener sing padha nransfer iki kanggo kita, nanging legal tanggung jawab dumateng klien - uga, sing, nginstall software kanggo wong, utawa nransfer data anonim. Nanging iki arang banget, amarga - anonymization bener utawa salah - ing paling kasus katergantungan antarane wong-wong mau wis ilang.

Sapa sing Tuku Piranti Lunak Pangenalan Rai?

  • Kita pancen arep menyang kene amarga piranti lunak utama sing kita adol yaiku telusuran pasuryan, analisis korelasi, lan kita adol menyang lembaga pemerintah. Lan setengah taun kepungkur, kita mutusake yen kabeh crita kasebut bakal dilebokake ing pariwara, ing marketing, menyang pasar umum - kaya mengkono Social Data Hub, entitas hukum komersial, dibentuk. Lan saiki kita mung teka kene. Kita wis nggandhol metu kene kanggo setengah taun saiki, nyoba kanggo nerangake kanggo wong sing ora perlu kanggo menehi wong downloads karo sebutno, sing padha kudu diwenehi jawaban kanggo pitakonan, sing ora perlu kanggo tonality. , lan sapanunggalane. Dadi angel ngomong ngendi ...
  • (Sapa sing sampeyan maksud?) Kanggo kabeh kanca sing kudu nggoleki teroris lan pedofil.
    Aku bisa langsung ngomong (iki bakal dadi pitakonan sabanjure): miturut data kita, ora ana guru sing dipenjara amarga dikirim maneh.
  • Ing VKontakte - 14%; ing Facebook ora ana profil sing ditutup kaya ngono (ana dhaptar kanca sing ditutup, lan liya-liyane). Lan sing paling menarik yaiku aku mung nulis pesen - saiki dheweke bakal ngetung lan ngomong.

Aja ngirim soko sampeyan bakal isin!

  • Aja ngirim apa-apa ing jaringan sosial sing bakal nggawe sampeyan isin - aku dhewe ngetutake iki. Senajan aku duwe akeh pribadi, amarga aku sumpah ing Facebook. Inggih, ana lan ana sing kudu ditindakake ... Aja ngirim apa wae sing bakal isin! Menawi badhe nyambut damel wonten pundi kemawon wonten ing Kamar Umum, inggih, langkung prayogi menawi boten komentar. Yen sampeyan ora bakal nindakake iki, umume, ora ana sing peduli. Aku mung bisa njamin yen ora ana sing maca korespondensi pribadi sampeyan, lan kabeh iki mbangun kabeh crita iki ...

    Saben minggu, mesthi ana wong sing marani aku lan ujar: "Inggih, foto kancaku bocor menyang sawetara kaca umum anonim! Tulung! Miturut cara, aja nerbitake apa-apa menyang kaca umum anonim.

  • Aku ora ngerti babagan sistem ngawasi liyane - kita mesthi bakal njupuk iki menyang akun, sing nyebut merek ana negatif, Gusti ngapura kula ... Nanging aku bisa ngomong sing kabeh limo cedhak-negara comrades mung kasengsem ing wong. sing duwe penonton luwih saka 5 ewu, lan pendapat umum bisa mengaruhi wong. Ing pengalamanku, durung nate kedadeyan manawa agensi HR sing menehi pambiji profil saka kita ujar: "Sapa sing seneng Navalny, aja nyewa sapa wae!"

Babagan nerbitake asil. Pira wong sing kerja ing riset?

  • Saka 10 perusahaan pariwara paling dhuwur, pitu saiki nerbitake. Iku angel ngomong: nalika kita miwiti iki lan setengah taun kepungkur ... Kita duwe sawetara wong ing saben wilayah - ana sawetara wong ing bank, ana sawetara wong ing HR, ana sawetara wong ing iklan. Lan saiki kita mikir babagan sapa sing luwih nguntungake dhisik, kanggo sapa kita kudu miwiti nggawe sawetara antarmuka ...
  • (kira-kira jumlah wong saben segmen pasar) Ora luwih saka 25 wong, amarga kita ora ngrugekke wong.
  • Umumé, ing prinsip, teknologi iki saka pasar digunakake, aku mikir, luwih saka 50%. Sawetara ing kampanye iklan, sawetara ing sawetara jinis analytics internal. Aku bakal ngomong 40 persen nggunakake ing analytics internal, 50-60% ngedol kanggo mungkasi merek. Nanging iki wis gumantung ing perusahaan iklan dhewe. Sampeyan ndeleng, sawetara wong nglaporake mung kanggo dhuwit sing dibuwang, pariwara sing dilebokake, dene liyane nulis pira wong sing digawa, pamirsa apa ... mbayangno carane kabeh comrades iki bisa. Aku ngerti mung ing data kuantitatif.

Sawetara iklan 🙂

Matur nuwun kanggo tetep karo kita. Apa sampeyan seneng karo artikel kita? Pengin ndeleng konten sing luwih menarik? Ndhukung kita kanthi nggawe pesenan utawa menehi rekomendasi menyang kanca, cloud VPS kanggo pangembang saka $4.99, analog unik saka server level entri, sing diciptakake kanggo sampeyan: Bebener kabeh babagan VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps saka $ 19 utawa carane nuduhake server? (kasedhiya karo RAID1 lan RAID10, munggah 24 intine lan nganti 40GB DDR4).

Dell R730xd 2 kaping luwih murah ing pusat data Equinix Tier IV ing Amsterdam? Mung kene 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV saka $199 ing Walanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - saka $99! Maca babagan Carane mbangun infrastruktur corp. kelas karo nggunakake Dell R730xd E5-2650 v4 server worth 9000 euro kanggo Penny?

Source: www.habr.com

Add a comment