Arthur Khachuyan: intel·ligència artificial en màrqueting

Arthur Khachuyan és un conegut especialista rus en processament de grans dades, fundador de l'empresa Social Data Hub (ara Tazeros Global). Soci de la National Research University Higher School of Economics. Va preparar i presentar, juntament amb la National Research University Higher School of Economics, un projecte de llei sobre Big Data al Consell de la Federació. Va intervenir a l'Institut Curie de París, Universitat Estatal de Sant Petersburg, Universitat Federal sota el Govern de la Federació Russa, a Red Apple, International OpenDataDay, RIW 2016, AlfaFuturePeople.

La conferència es va gravar al festival a l'aire lliure "Geek Picnic" a Moscou el 2019.

Arthur Khachuyan: intel·ligència artificial en màrqueting

Artur Khachuyan (d'ara endavant - AH): – Si des d'un gran nombre d'indústries, des de la medicina, des de la construcció, des d'alguna cosa, alguna cosa, fins a triar aquella on s'utilitza més sovint la tecnologia de big data, aprenentatge automàtic i aprenentatge profund, probablement aquest sigui màrqueting. Perquè des de fa tres anys aproximadament, tot el que ens envolta en algun tipus de comunicacions publicitàries ara està lligat precisament a l'anàlisi de dades i precisament al que es pot anomenar intel·ligència artificial. Per tant, avui us parlaré d'això d'una història tan llunyana...

Si us imagineu la intel·ligència artificial i el que sembla, probablement sigui una cosa així. L'estranya imatge és una de les xarxes neuronals que vaig escriure fa un any per trobar la dependència del que fa el meu gos: quantes vegades necessita ser gran, petit i com depèn en general de quant menja? o no?. Aquesta és una broma sobre com es podria imaginar la intel·ligència artificial.

Arthur Khachuyan: intel·ligència artificial en màrqueting

Però tot i així, pensem com funciona tot en les comunicacions publicitàries. Hi ha tres maneres en què els algorismes moderns de publicitat i màrqueting poden interactuar amb nosaltres. És evident que la primera història té com a objectiu obtenir i extreure coneixements addicionals sobre tu i mi, i després utilitzar-lo per a alguns propòsits bons i no tan bons; personalitzar l'enfocament a cada persona concreta; Naturalment, després d'això, creeu una certa demanda per dur a terme l'acció principal objectiu i realitzar una determinada venda.

Mitjançant la tecnologia, intenten resoldre el problema de la comunicació eficaç

Si et dic que penses en què Pornhub i M. Vídeo”, què estàs pensant?

Comentaris de l'audiència (d'ara endavant, C): - Televisió, audiència.

OH: – El meu concepte és que són dos llocs on la gent ve per un determinat tipus de servei, o diguem-ne un determinat tipus de béns. I aquest públic és diferent perquè no vol dir res al venedor. Ella vol entrar i obtenir allò que li interessa d'alguna forma explícita o implícita. Naturalment, ningú vingui a M. Video” no vol comunicar-se amb cap venedor, no vol entendre, no vol respondre cap de les seves preguntes.

Per tant, de tot això es desprèn la primera història.

Quan van aparèixer tecnologies per obtenir coneixements addicionals per evitar d'alguna manera la comunicació amb una persona. A tots ens encanta quan truquem al banc i el banc ens diu: “Hola. Alexey, ets el nostre client VIP. Ara un súper gerent parlarà amb tu. Vens a aquest banc i realment hi ha un gerent únic que pot parlar amb tu. Malauradament o afortunadament, ni una sola empresa encara ha sabut com contractar mil gestors personals per a mil clients; i com que la majoria d'aquestes persones estan ara en línia, la tasca és entendre quin tipus de persona és i com comunicar-se correctament amb ell abans que arribi a algun recurs publicitari. I per tant, de fet, han aparegut tecnologies que intenten resoldre aquest problema.

L'extracció de dades és el nou oli

Imaginem que sou el propietari d'una parada de flors. Tres persones vénen a veure't. El primer s'atura molt de temps, dubta, intenta parlar amb tu, agafa alguna mena de ram: vas a embolicar-lo, surts a fer-hi alguna cosa; fuig de la parada amb aquest ram: has perdut els teus tres mil rubles. Per què va passar? No saps res d'aquesta persona: desconeixes el seu historial de detencions al Ministeri de l'Interior, no saps que és cleptòman i està donat d'alta en un dispensari psiquiàtric. Per què? Perquè ho vas veure per primera vegada i no ets un analista conductual.

Algú més ve... Vitaly. Vitaly també triga molt a esbrinar-ho, diu: "Bé, necessito això i allò". I tu li dius: "Flors per a la mare, oi?" I li vens un ram.

El concepte aquí és trobar dades suficients per entendre què necessita realment la persona. Tothom va pensar immediatament en algun tipus de xarxes publicitàries i així successivament...

Segurament tothom ha sentit més d'una vegada la frase estúpida que "les dades són el nou petroli"? Segur que tothom ho ha sentit. De fet, la gent va aprendre a recollir dades fa força temps, però extreure dades d'aquestes dades és la tasca que ara intenta resoldre la intel·ligència artificial en màrqueting, o algun tipus d'algoritmes estadístics. Per què? Perquè si parles amb una persona, et pot donar una resposta correcta, incorrecta o d'alguna manera amb color. La broma que explico als meus alumnes és com es diferencien les enquestes de les estadístiques. Us ho diré com a anècdota:

Això vol dir que en dos pobles van decidir fer un estudi sobre la durada mitjana de la virilitat. Això vol dir que al primer poble, Villaribo, la longitud mitjana és de 15 centímetres, al poble de Villabaggio - 25. Saps per què? Perquè al primer poble es van fer mesures, i al segon es va fer una enquesta.

La indústria del porno és el vaixell insígnia dels sistemes de recomanació

És per això que l'enfocament modern és analitzar totes les persones sense excepció, encara que siguin una mica menys del 100%, però aquestes són les persones a les quals no cal preguntar, no cal que les mireu. N'hi ha prou amb analitzar el que ara s'anomena petjada digital per entendre què necessita aquesta persona, com parlar-li correctament, com crear correctament demanda al seu voltant. D'una banda, aquesta és una màquina sense sentit (però tu i jo ho sabem molt bé); no volem comunicar-nos amb gent de M. Vídeo”, i encara més, quan anem a recursos com Pornhub, volem obtenir exactament el que necessitem.

Per què sempre parlo de Pornhub? Perquè la indústria adulta és la primera a venir a l'anàlisi d'aquestes tecnologies, a la implementació d'aquestes tecnologies, a l'anàlisi de dades. Si agafeu les tres biblioteques més populars d'aquesta àrea (per exemple, TensorFlow o Pandas per a Python, per processar fitxers CSV, etc.), si l'obreu a Github, amb un Google breu de tots aquests noms trobareu un parell de persones que treballaven o treballen actualment a l'empresa Pornhub i van ser els primers a implementar-hi sistemes de recomanació. En general, aquesta història està molt avançada, i mostra fins a quin punt aquest públic, com ha avançat aquesta empresa.

Arthur Khachuyan: intel·ligència artificial en màrqueting

Tres nivells d'identificació

Hi ha un conjunt enorme de dades al voltant d'una persona que es poden identificar. Normalment divideixo això formalment en tres nivells, aprofundint cada cop més. Naturalment, l'empresa té les seves pròpies dades.

Si, per exemple, estem parlant de construir un sistema de recomanació, el primer nivell són les dades que es troben a la pròpia botiga (historial de compres, tot tipus de transaccions, com una persona va interactuar amb la interfície).

A continuació, hi ha un nivell (relativament el més gran): això és el que s'anomena fonts obertes. No us penseu que us animo a esborrar les xarxes socials, però de fet, el que està disponible en fonts obertes obre un conjunt enorme de dades que podeu, per exemple, aprendre sobre una persona.

I la tercera part important és l'entorn d'aquesta persona. Sí, hi ha l'opinió que si una persona no està a les xarxes socials, no hi ha dades sobre ella (segurament ja sabeu que això no és cert), però el més important és que les dades que hi ha al perfil d'una persona (o en alguna aplicació) és només el 40% del coneixement que es pot obtenir al respecte. La resta de la informació s'obté del seu entorn. La frase “digues qui és el teu amic i et diré qui ets” adquireix un nou significat al segle XXI perquè es poden obtenir una gran quantitat de dades al voltant d'aquesta persona.

Si parlem més a prop de les comunicacions publicitàries, aleshores rebre comunicacions publicitàries no de la publicitat, sinó d'algun amic, conegut o d'alguna manera verificada és una característica molt interessant que fan servir molts venedors. Quan alguna aplicació us ofereix de sobte un codi promocional gratuït, feu una publicació al respecte i, per tant, atreu un públic nou. De fet, aquest codi promocional per al condicional "Yandex.Taxi" no es va escollir a l'atzar, però per això es va analitzar una gran quantitat de dades sobre el vostre potencial per atraure un nou públic i d'alguna manera interactuar amb ells.

Arthur Khachuyan: intel·ligència artificial en màrqueting

Fins i tot analitzen el comportament dels personatges de les sèries de televisió

Et mostraré tres imatges i tu em dius quina diferència hi ha entre elles.

Aquest:

Arthur Khachuyan: intel·ligència artificial en màrqueting

Això:

Arthur Khachuyan: intel·ligència artificial en màrqueting

I aquest:

Arthur Khachuyan: intel·ligència artificial en màrqueting

Quina diferència hi ha entre ells? Aquí tot és senzill. Com en la mecànica quàntica, en aquest cas aquesta creativitat va ser formada per l'observador. És a dir, la diferència en una mateixa campanya publicitària, realitzada per la mateixa marca al mateix temps, està només en qui mirava aquest missatge publicitari. Personalment, quan vaig a Amediateka, encara mostren Khal Drogo. No sé què pensa Amediateka sobre les meves preferències, però per alguna raó això passa.

El que ara s'anomena comunicacions personalitzades és la història més popular d'atreure una audiència i interactuar correctament amb ella. Si en una primera etapa vam identificar persones utilitzant dades de la nostra pròpia marca, dades de fonts obertes i, per exemple, dades de l'entorn d'aquesta persona, després d'analitzar-la, podem entendre qui és, com parlar-hi correctament. i, el més important, quina llengua parla parla amb ell.

Aquí la tecnologia ha arribat tan lluny que ara s'estan analitzant els personatges de les sèries de televisió que la gent veu. És a dir, t'agraden les sèries de televisió: es veuen [els likes], es miren amb qui vas interactuar allà, per entendre amb quina persona seria adequada per a tu. Sembla una ximpleria total, però només per diversió, proveu-ho en un dels recursos: diferents persones veuen diferents creativitats (per interactuar-hi correctament).

Ni un sol mitjà modern ni cap recurs de vídeo només us mostra algunes notícies. Aneu als mitjans de comunicació: es carreguen un gran nombre d'algorismes que us identifiquen, comprenen tota la vostra activitat anterior, apel·len al model matemàtic i us mostren alguna cosa. En aquest cas, hi ha una història tan estranya.

Com es determinen les necessitats? Psicometria. La fesomia

Hi ha molts enfocaments (reals) per determinar les necessitats reals d'una persona i com comunicar-s'hi correctament. Hi ha molts plantejaments, tot es resol d'una altra manera, és impossible dir quina és bona i quina és dolenta. Els principals sembla que ho saben tot.

Arthur Khachuyan: intel·ligència artificial en màrqueting

Psicometria. Després de la història amb Cambridge Analytics, al meu entendre, va prendre una mena de gir impactant, perquè ara cada segona empresa política ve i diu: "Oh, pots fer-me com Trump? Jo també vull guanyar, i així successivament”. De fet, això, és clar, és una tonteria per a les nostres realitats, per exemple, les eleccions polítiques. Però per determinar els psicotips s'utilitzen tres models:

  • el primer es basa en el contingut que consumeix: les paraules que escrius, alguna informació que t'agrada, vídeos, etc.;
  • el segon està lligat a com interactueu amb la interfície web, com escriviu, quins botons premeu; de fet, hi ha empreses senceres que, basant-se en la seva escriptura del teclat, poden determinar de manera bastant fiable el que ara s'anomena psicotips.
  • No sóc gaire psicòleg, no entenc molt com funciona, però des del punt de vista de les comunicacions publicitàries, les audiències dividides en aquests segments funcionen molt bé, perquè cal mostrar a algú una pantalla vermella amb un blau. dona, cal mostrar a algú una pantalla fosca: fons blau amb algun tipus d'abstracció, i funciona molt bé. En alguns nivells baixos, tant és així que una persona ni tan sols hi pensa. Quin és el principal problema del mercat publicitari ara? Tothom és un agent d'intel·ligència, tothom s'amaga, tothom té instal·lats un milió de mil permisos de navegador per no ser identificats de cap manera: probablement tingueu "Adblocks", "Gostrey" i tot tipus d'aplicacions que bloquegen el seguiment. Per això, és molt difícil entendre res d'una persona. I la tecnologia ha avançat: no només cal saber que aquesta persona ha tornat al vostre lloc per 125a vegada, sinó que també és una persona tan estranya.

La fisonomia és una ciència molt controvertida. Ni tan sols es considera ciència. Es tracta d'un grup de persones que abans programaven detectors de mentides per a algun Ministeri de l'Interior, i ara es dediquen al que s'anomena personificació de la creativitat. El plantejament aquí és molt senzill: diverses de les vostres fotografies públiques estan preses d'algunes xarxes socials i a partir d'elles es construeix la geometria tridimensional. I si ets advocat, ara diràs que es tracta d'una persona i dades personals; però et diré que són 300 mil punts situats a l'espai, i això no és una persona, ni és una dada personal. Això és el que tothom sol dir quan el Roskomnadzor els ve.

Però seriosament, la teva cara per separat, si el teu nom i cognoms no hi estan signats, no són les teves dades personals. La qüestió és que els nois marquen diversos trets facials que influeixen en com una persona pren decisions i com interactuar amb ella correctament. En algunes zones això funciona malament, en alguns segments publicitaris; en quins segments funciona molt bé. Al final, resulta que quan vas a algun recurs, no veus només una pancarta que es mostra a tothom, sinó que, per exemple... ara és normal fer 16 o 20 opcions per a diferents públics -i funciona. molt guai. Sí, això és encara més trist des del punt de vista del consumidor, perquè la gent comença a ser cada cop més manipulada. Però tanmateix, des del punt de vista empresarial funciona molt bé.

La caixa negra de l'aprenentatge automàtic

Això dóna lloc al següent problema amb aquestes tecnologies: després de tot, per a la majoria dels desenvolupadors ara el que s'anomena aprenentatge profund és una "caixa negra". Si alguna vegada us heu submergit en aquesta història i heu parlat amb els desenvolupadors, sempre diuen: "Oh, escolta, bé, hem codificat una cosa tan incomprensible allà i no sabem com funciona". Potser algú li ha passat això.

Això en realitat està lluny de ser cert. El que ara s'anomena aprenentatge automàtic està lluny de ser una "caixa negra". Hi ha una gran quantitat d'enfocaments per descriure les dades d'entrada i sortida i, al final, l'empresa pot entendre a fons sobre la base de quins signes la màquina va decidir mostrar-vos aquest vídeo pornogràfic o un altre. La qüestió és que cap de les empreses ho revela mai, perquè: en primer lloc, és un secret comercial; en segon lloc, hi haurà una gran quantitat de dades que ni tan sols coneixíeu.

Per exemple, abans d'això, en una discussió sobre ètica, vam parlar de com les xarxes socials analitzen els missatges personals per etiquetar persones en algun tipus d'històries publicitàries. Si escrius alguna cosa a algú, en funció d'això rebràs una etiqueta específica per, de fet, algun tipus de comunicacions publicitàries. I no ho demostraràs mai, i probablement no tingui sentit demostrar-ho. Tanmateix, si es revelessin patrons similars, existirien. Resulta que el mercat per construir aquests sistemes de recomanació pretén no saber per què va passar això.

La gent no vol saber què sap d'ells

I la segona història és que el client mai vol saber per què va rebre aquest anunci en concret, aquest producte en concret. Us explicaré aquesta història. La meva primera experiència en la implementació comercial de sistemes de recomanació basats en algorismes similars precisament per la investigació va ser l'any 2015 en una xarxa molt gran de sex shops (sí, tampoc una història especialment desagradable).

Arthur Khachuyan: intel·ligència artificial en màrqueting

Als clients se'ls va oferir el següent: entren, inicien sessió amb la seva xarxa social i, al cap d'uns 5 segons, reben una botiga completament personalitzada per a ells, és a dir, tots els productes han canviat, entren en una categoria determinada, etc. . Saps quant ha augmentat el percentatge de conversions d'aquesta botiga? De cap manera! La gent va entrar i va fugir de seguida. Van entrar i es van adonar que els van oferir exactament el que estaven pensant...

El problema d'aquesta prova era que sota cada producte hi havia escrit per què t'oferien aquell en concret (“perquè ets membre del grup ocult “La dona poderosa busca un home que sigui un estora”). Per tant, els sistemes de recomanació moderns mai mostren les dades a partir de les quals es va fer la "predicció".

Una història molt popular són els mitjans de comunicació perquè tots utilitzen sistemes de recomanació similars. Abans, els algorismes eren molt senzills: mireu la categoria "Política" i us mostren notícies de la categoria "Política". Ara tot és tan complicat que analitzen els llocs on vau aturar el ratolí, en quines paraules us heu concentrat, què heu copiat, com heu interaccionat generalment amb aquesta pàgina. Després analitza el vocabulari dels mateixos missatges: sí, no només llegeixes notícies sobre Putin, sinó que d'alguna manera, amb un cert color emocional. I quan una persona rep alguna notícia, ni tan sols pensa en com va arribar aquí. No obstant això, llavors interactua amb aquest contingut.

Tot això, naturalment, té com a objectiu mantenir el pobre i desgraciat home que ja s'està tornant boig per la gran quantitat d'informació que l'envolta. Aquí cal dir que estaria bé utilitzar aquests sistemes per personalitzar el creatiu que t'envolta i recopilar informació, però, malauradament, encara no existeixen aquests serveis.

La intel·ligència artificial atrapa el client a l'aire i crea demanda

I aquí sorgeix una qüestió filosòfica molt interessant, passar de crear un sistema de recomanació a crear demanda. Poques vegades algú s'ho pensa, però quan intentes preguntar a l'anomenat Instagram: "Per què estàs recopilant dades? Per què no em mostres publicitat absolutament aleatòria?" - Instagram et dirà: "Amic, tot això està fet per mostrar-te exactament el que t'interessa". Com, volem conèixer-te amb tanta precisió que et podem mostrar exactament el que estàs buscant.

Arthur Khachuyan: intel·ligència artificial en màrqueting

Però la tecnologia fa temps que ha travessat aquest terrible llindar i tecnologies similars ja no prediuen el que necessiteu. Ells (atenció!) creen demanda. Aquesta és probablement la cosa més espantosa que gira al voltant de la intel·ligència artificial en aquestes comunicacions. El més espantós és que s'ha utilitzat gairebé a tot arreu durant els darrers 3-5 anys, des dels resultats de la cerca de Google fins als resultats de la cerca de Yandex, fins a alguns sistemes... D'acord, no diré res de dolent sobre Yandex; i bo.

Quin és el punt? Fa molt de temps que aquestes comunicacions publicitàries s'han allunyat de l'estratègia en què escriu "Vull comprar un seient per a nens" i veus cent mil milions de publicacions. Van passar al següent: tan bon punt la dona penjava una foto amb la panxa poc visible, immediatament el seu marit començava a ser seguit per missatges: “Home, el part és aviat. Compra un seient per a nens".

Aquí, podríeu preguntar-vos raonablement, per què, amb aquests avenços tecnològics tan gegantins, encara veiem publicitat tan merda a les xarxes socials? El problema és que en aquest mercat tot està decidit pels diners, així que un bon moment pot venir algun anunciant com Coca-Cola i dir: "Aquí tens 20 milions per a tu: mostra els meus pancartes de merda a tot Internet". I realment ho faran.

Però si feu algun tipus de compte net i comproveu amb quina precisió aquests algorismes us endevinen: primer intenten endevinar-vos i després comencen a fer-vos alguna cosa per endavant. I el cervell humà funciona de tal manera que, en rebre informació fiable per a ell, ni tan sols processa el moment per què ha rebut aquesta informació. La primera regla per determinar que estàs en un somni és entendre com vas arribar aquí. Una persona mai recorda el moment en què va acabar en una habitació determinada. Aquí és el mateix.

Google pot començar a donar forma a la vostra visió del món

Aquests estudis els van dur a terme diverses empreses estrangeres que es dediquen a l'i-tracking. Van instal·lar dispositius en ordinadors especials que registren on estan mirant els ulls del subjecte de la prova. Vaig agafar de cinc a set mil voluntaris que simplement desplaçaven el feed, interactuaven amb les xarxes socials, amb la publicitat i enregistraven informació sobre quines parts dels bàners i els creatius deixaven de mirar aquestes persones.

I resulta que quan les persones reben una creativitat tan hiperpersonalitzada, ni tan sols s'ho pensen: de seguida avancen, comencen a interactuar amb ella. Des d'un punt de vista empresarial, això és bo, però des del punt de vista de nosaltres, com a usuaris, això no és genial, perquè - de què tenen por? – Que en un bon moment el condicional “Google” pugui començar (o, és clar, potser no comenci) a formar la seva pròpia visió del món. Demà, per exemple, pot començar a mostrar a la gent notícies que la terra és plana.

És broma, però els han agafat tantes vegades que durant les eleccions comencen a donar certa informació a determinades persones. Tots estem acostumats al fet que el cercador ho rep tot amb honestedat. Però, com sempre dic, si realment vols saber com funciona el món, escriu el teu propi cercador, sense filtres, sense parar atenció als drets d'autor, sense classificar alguns dels teus amics als resultats de la cerca. La visualització de dades reals a Internet és generalment diferent de la que mostren Google, Yandex, Bing, etc. Alguns materials s'amaguen perquè amics, companys, enemics o algú altre (o un antic amant amb qui vau dormir), no importa.

Com va guanyar Trump

Quan hi va haver les darreres eleccions als Estats Units, es va fer un estudi molt senzill. Van rebre les mateixes sol·licituds en diferents llocs, des de diferents adreces IP, des de diferents ciutats, diferents persones van fer el mateix a Google. Convencionalment, la petició era a l'estil de: qui guanyarà les eleccions? I sorprenentment, els resultats es van construir de tal manera que en aquells estats on el major nombre de persones va intentar votar pel candidat equivocat, van rebre algunes bones notícies sobre el candidat que Google va promoure. Quin? Bé, està clar quin: el que es va convertir en president. Aquesta és una història absolutament indemostrable, i tots aquests estudis són un dit a l'aigua. Google pot dir: "Nois, tot això es fa perquè us mostrin el contingut més rellevant".

A partir d'ara, hauríeu de saber que el que s'anomena màximament rellevant no és absolutament el cas. L'empresa diu alguna cosa rellevant que us cal vendre per alguna raó bona o dolenta.

Els que ara no tenen diners ja s'estan preparant per a futures compres

Hi ha un altre punt interessant aquí que us explicaré. Un gran nombre de públics actius ara a les xarxes socials i a les aplicacions són joves. Diguem-ho així: joves insolvents: nens de 8 a 9 anys que juguen a jocs estúpids, aquests són 12-13-14 anys que acaben de registrar-se a les xarxes socials. Per què les grans empreses gastarien pressupostos i recursos enormes per crear aplicacions per a un públic que no paga i que mai no es monetitza? En el moment en què aquest públic esdevingui solvent, hi haurà una quantitat suficient de dades sobre ell per predir molt bé el seu comportament.

Arthur Khachuyan: intel·ligència artificial en màrqueting

Ara pregunta a qualsevol targetòleg, quin és el públic més difícil? Diran: altament rendible. Perquè vendre, per exemple, un apartament per valor de 150 milions de rubles a través de les xarxes socials és gairebé impossible. Hi ha casos aïllats en què fas algun tipus de publicitat per a 10 mil persones, un compra aquest pis, el client és un èxit... Però un de cada deu mil, des del punt de vista estadístic, és una merda total. Aleshores, per què és difícil identificar un públic amb ingressos elevats? Perquè les persones que ara són membres d'un públic molt rendible van néixer quan Internet encara era molt petita, quan encara ningú coneixia a Artemy Lebedev i no hi ha informació sobre ells. És impossible predir el seu patró de comportament, és impossible entendre qui són els seus líders d'opinió i de quines fonts de contingut reben.

Així, quan tots us torneu multimilionaris en 25 anys, i les empreses que us vendran alguna cosa tindran una gran quantitat de dades. És per això que ara tenim un meravellós GDPR a Europa que impedeix la recollida de dades de menors.

Naturalment, això no funciona gens a la pràctica, ja que tots els nens encara juguen amb els comptes de la seva mare i el seu pare, així és com es recull la informació. La propera vegada que doneu una tauleta al vostre fill, penseu-hi.

Absolutament no un futur espantós i distòpic, quan tothom morirà en una guerra amb màquines, una història absolutament real ara. Hi ha un gran nombre d'empreses que estan creant algorismes per a perfils psicològics de persones basats en com juguen. Una indústria molt interessant. A partir de tot això, les persones són segmentades per tal de comunicar-se d'alguna manera amb elles.

Arthur Khachuyan: intel·ligència artificial en màrqueting

La predicció del comportament d'aquestes persones estarà disponible d'aquí a 10-15 anys, precisament en el moment en què esdevinguin un públic solvent. El més important és que aquestes persones ja han donat permís per endavant per tractar les seves dades personals, cedir-les a tercers, i tot això és felicitat, etc.

Qui perdrà la feina?

I la meva última història és que tothom es pregunta sempre què passarà d'aquí a 50 anys: morirem tots, hi haurà atur per als màrquetings... Aquí hi ha màrquetings que estan preocupats per l'atur, oi? En general, no cal preocupar-se, perquè qualsevol persona altament qualificada no perdrà la feina.

Arthur Khachuyan: intel·ligència artificial en màrqueting

No importa quins algorismes es creïn, per molt que la màquina s'acosti al que tenim aquí (assenyala el seu cap), si es desenvolupa amb prou rapidesa, aquestes persones mai es quedaran ocioses, perquè algú haurà de crear aquestes coses creatives. fer. Sí, hi ha tota mena de "gans" que dibuixen dibuixos que semblen persones i creen música, però encara és poc probable que la gent d'aquesta zona perdi mai la seva feina.

Arthur Khachuyan: intel·ligència artificial en màrqueting

Ho tinc tot amb la història, així que pots fer preguntes si en tens més. Gràcies.

Arthur Khachuyan: intel·ligència artificial en màrqueting

Moderador: – Amics, ara passem al bloc “Preguntes i respostes”. Tu aixeques la mà - jo vinc cap a tu.

Arthur Khachuyan: intel·ligència artificial en màrqueting

Pregunta de l'audiència (XNUMX): – Pregunta sobre la “caixa negra”. Van dir que era possible entendre específicament per què es va obtenir tal o tal resultat per a tal o tal usuari. Es tracta d'una mena d'algorismes, o cal analitzar-los cada vegada per a cada model ad hoc (nota de l'autor: "especialment per a això" - una unitat fraseològica llatina)? O n'hi ha de preparades per a algun tipus de xarxa neuronal que, a grans trets, pot tenir sentit comercial?

OH: – Aquí heu d'entendre el següent: hi ha un gran nombre de tasques en l'aprenentatge automàtic. Per exemple, hi ha una tasca: regressió. Per a la regressió, no es necessiten xarxes neuronals. Tot és senzill: tens diversos indicadors, has de calcular el següent. Hi ha tasques on cal recórrer a un aprenentatge profund. De fet, en l'aprenentatge profund és difícil entendre de manera fiable quins pesos es van assignar a quines neurones, però legalment tot el que necessiteu és entendre quines dades hi havia a l'entrada i com es van produir a la sortida. Això és suficient legalment per patentar aquesta decisió i n'hi ha prou per entendre sobre quina base es va fer la història.

No és com si vau anar al lloc i us van mostrar una mena de pancarta perquè vau fer una foto amb els cabells vermells a Instagram fa dos mesos. Si el desenvolupador no inclou la recollida d'aquestes dades i el marcatge del color del cabell en aquest model, no sortirà del no-res.

Com vendre els resultats dels sistemes d'aprenentatge automàtic?

Z: – Només és una qüestió de què: com explicar exactament, com vendre a algú que no entén l'aprenentatge automàtic. Vull dir: el meu model porta clarament del color del cabell a... bé, canvia el color del cabell... Això és possible o no?

Arthur Khachuyan: intel·ligència artificial en màrqueting

OH: - Potser sí. Però des del punt de vista comercial, l'únic esquema funcionarà: tens una campanya publicitària, substituïm l'audiència per la generada per la màquina -i només veus el resultat. Malauradament, aquesta és l'única manera de convèncer de manera fiable el client que aquesta història funciona, perquè hi ha moltes solucions al mercat que abans es van implementar i no van funcionar.

Sobre la creació d'una personalitat virtual

Z: - Hola. Gràcies per la conferència. La pregunta és: quina oportunitat té una persona, que per alguna raó no vol seguir el camí de l'aprenentatge automàtic, de crear-se una personalitat virtual que sigui radicalment diferent de la seva pròpia personalitat, a través de la interacció amb la interfície o per a alguns? un altre motiu?

Arthur Khachuyan: intel·ligència artificial en màrqueting

OH: – Hi ha un munt de connectors diferents que tracten específicament el comportament aleatori. Hi ha una cosa genial: Ghostery, que, al meu entendre, us amaga gairebé completament d'un munt de rastrejadors diferents que no poden registrar aquesta informació. Però de fet, ara només cal un perfil tancat a les xarxes socials perquè ningú, cap rascador malvat, hi pugui recollir res. Probablement sigui millor instal·lar algun tipus d'extensió o escriure alguna cosa tu mateix.

Ja veus, el concepte aquí és que legalment, per exemple, les dades personals fan referència a les dades amb les quals et pots identificar, i la llei posa com a exemple la teva adreça de residència, edat, etc. Avui dia hi ha una infinitat de dades per les quals et pots identificar: la mateixa lletra del teclat, la mateixa premsa, la signatura digital del navegador... Tard o d'hora, una persona s'equivoca. Pot estar en algun lloc d'un "cafè" fent servir "Thor", però al final, en un bon moment, la VPN s'oblidarà d'encendre's o una altra cosa, i en aquest moment es pot identificar. Per tant, la manera més senzilla és crear un compte privat i instal·lar alguna extensió.

El mercat s'està movent cap al punt en què només cal prémer un botó per obtenir resultats.

Z: - Gràcies per la història. Com sempre, sempre molt interessant (us segueixo). La pregunta és: quin avenç hi ha pel que fa a la creació de sistemes positius per als usuaris, sistemes de recomanació? Vas dir que en un moment estaves treballant en un sistema de recomanacions per trobar una parella sexual, un amic a la vida (o una música que potencialment li agradaria a una persona)... Què prometedor és tot això, i com veus el seu desenvolupament a partir de el punt de vista de crear sistemes que la gent necessita?

OH: – En general, el mercat s'està movent fins al punt que la gent necessita prémer un botó i obtenir immediatament el que necessita. Pel que fa a la meva experiència en la creació d'aplicacions de cites (per cert, la rellançarem a finals d'any), a més del fet que el 65% eren homes casats, el problema de recomanació més difícil va ser que a una persona se li ofereixen diversos models. a l'inici de l'aplicació: "Amistat", "Sexe", "Amistat sexual" i "Negocis". La gent no va triar el que necessitava. Els homes van venir i van triar "Amor", però en realitat van llançar nuesa a tothom, etc.

El problema va ser identificar una persona que no s'ajusta a un d'aquests models i, d'alguna manera, agafar-la sense problemes i moure-la en l'altra direcció. A causa de la petita quantitat de dades, és molt difícil determinar si es tracta d'un error en l'algorisme de previsió o si una persona no es troba en la seva categoria. Passa el mateix amb la música: ara hi ha molt pocs algorismes realment dignes que puguin "facast" bé la música. Potser "Yandex.Music". Algunes persones pensen que l'algoritme Yandex.Music és dolent. Per exemple, m'agrada ella. A mi personalment, per exemple, no m'agrada l'algoritme de música de YouTube, etc.

Hi ha, per descomptat, algunes subtileses: tot està lligat a llicències... Però, en realitat, la demanda d'aquests sistemes és bastant alta. En un moment, era coneguda l'empresa Retail Rocket, que participava en la implementació de sistemes de recomanació, però ara d'alguna manera no els va molt bé, pel que sembla perquè no van desenvolupar els seus algorismes durant molt de temps. Tot va cap a això, fins al punt que entrem i, sense pressionar res, aconseguim el que necessitem (i ens tornem completament estúpids, perquè la nostra capacitat de triar ha desaparegut completament).

Màrqueting d'influència

Z: - Hola. Em dic Konstantin. M'agradaria plantejar una pregunta sobre el màrqueting d'influències. Coneixeu algun sistema que permeti a una empresa seleccionar un blogger adequat per a l'empresa a partir d'algunes dades estadístiques i així successivament? I per quins motius es fa això?

Arthur Khachuyan: intel·ligència artificial en màrqueting

OH: – Sí, començaré de lluny i de seguida diré que el problema de totes aquestes tecnologies és que tota aquesta intel·ligència artificial en màrqueting és ara com un funambulista: a l'esquerra hi ha grans empreses que tenen molts diners, i en en tot cas tot serà efectiu perquè funcionin perquè les seves campanyes publicitàries estan dirigides simplement a les visualitzacions; d'altra banda, hi ha moltes petites empreses per a les quals això no funcionarà, perquè tenen moltes dades. Fins ara, l'aplicabilitat d'aquestes històries es troba en algun lloc intermedi.

Quan ja hi ha bons pressupostos, i la tasca és processar aquests pressupostos correctament (i, en principi, ja hi ha força dades)... Conec un parell de serveis, una cosa com Getblogger, que semblen tenir algorismes. Per ser sincer, no he estudiat aquests algorismes. Us puc dir quin enfocament fem servir per trobar líders d'opinió quan hem de fer un regal a algunes mares.

Utilitzem una mètrica anomenada Temps de distribució de contingut. Funciona així: agafes una persona el públic de la qual estàs analitzant i has de recollir sistemàticament (per exemple, un cop cada 5 minuts) informació de cada publicació, a qui li ha agradat, a qui l'ha comentat, etc. D'aquesta manera, podeu entendre en quin moment cada persona del vostre públic va interactuar amb el vostre contingut. Repetiu aquesta operació per a cada representant de la seva audiència, i així, utilitzant la mètrica del temps mitjà de difusió del contingut, es pot, per exemple, pintar-se en un gran gràfic de xarxa d'aquestes persones i utilitzar aquesta mètrica per construir clústers.

Això funciona força bé si volem, per exemple, trobar 15 mares que mantinguin la seva opinió pública en alguna woman.ru. Però aquesta és una implementació tècnica força complexa (tot i que purament teòricament es pot fer a Python). La conclusió és que el problema del màrqueting d'influències a les grans agències de publicitat és que necessiten bloggers grans, genials i cars que no treballin per merda. Ara, una marca d'automòbils vol vendre algun producte a través d'algun líder d'opinió: han d'utilitzar un blogger de cotxes com a últim recurs, perquè el seu públic ja ha comprat un cotxe o sap exactament quin tipus de cotxe vol, només s'asseu i mira cotxes genials. Aquí és important no perdre's l'anàlisi de l'audiència de la mateixa persona.

Bots de màrqueting

Z: – Digues-me, quant afecten els bots a les xarxes socials en la recollida d'informació i la seva qualitat?

Arthur Khachuyan: intel·ligència artificial en màrqueting

OH: – És una cosa molt interessant amb els bots. Els robots barats són bastant fàcils d'identificar: o tenen el mateix contingut, o són amics entre ells o estan a la mateixa xarxa. També hi ha enfocaments per tractar amb robots complexos. O estàs preguntant el problema com connectar una persona amb el seu fals?

Z: – Quina informació de gran qualitat serà la sortida amb tota aquesta escombraria?

OH: – Aquí funciona d'aquesta manera: a causa del fet que hi ha una gran quantitat de dades (per exemple, per a algun tipus d'investigació de màrqueting), tota aquesta broma simplement es pot llençar. És a dir, és millor llençar una mica més de gent real que capturar bots, perquè és inútil que mostrin cap publicitat. Però si recopileu mètriques, per exemple, interaccions amb bàners o sistemes de recomanació, aquests comptes es poden llençar.

Ara a les xarxes socials, hi ha aproximadament un sis per cent de personatges virtuals o simplement pàgines abandonades o introvertits, a qui els algorismes "coincideixen" com a robots. Pel que fa a vincular una persona amb el seu fals, també aquí tot està lligat al fet que la persona tard o d'hora s'equivocarà, i el cas és que el model de comportament és el mateix, tant el seu compte real com el seu fals. Tard o d'hora miraran el mateix contingut o alguna cosa més.

Aquí tot no es redueix al percentatge d'error, sinó a la quantitat de temps necessària per identificar de manera fiable una persona. Per a algú que viu amb el seu Instagram, aquest temps per a una identificació fiable es redueix a cinc minuts. Per a alguns, de sis a vuit mesos.

A qui i com vendre les dades?

Z: - Hola. M'interessa saber com es venen les dades entre empreses? Per exemple, tinc una aplicació en la qual pots saber (al desenvolupador) on va una persona, a quines botigues va i quants diners hi gasta. I m'interessa saber com, diguem-ne, puc vendre dades sobre el meu públic a aquestes botigues o posar les meves dades en una base de dades enorme i cobrar-ho?

Arthur Khachuyan: intel·ligència artificial en màrqueting

OH: – Pel que fa a la venda de dades directament a algú, vosaltres i tots els altres estaveu per davant de l'OFD, operadors de dades fiscals, que s'han construït astutament entre la transferència de xecs i el Servei d'Impostos i ara intenten vendre dades a tothom. De fet, van estavellar tot el mercat d'anàlisi mòbil. De fet, podeu incrustar la vostra aplicació, per exemple, el píxel de Facebook, el seu sistema DMP; a continuació, utilitzeu aquest públic per vendre. Per exemple, el píxel "May Target". Simplement no sé quin tipus de públic tens, cal que ho entenguis. Però en qualsevol cas, podeu integrar-vos a Yandex o My Target, que són els sistemes DMP més grans.

Aquesta és una història força interessant. L'únic problema és que els donaràs tot el trànsit, i ells, com a intercanvis, assumiran la monetització d'aquest trànsit. Et poden dir o no que 10 persones han utilitzat el teu públic. Per tant, o creeu la vostra pròpia xarxa publicitària o us rendeu a grans DMP.

Qui guanyarà: l'artista o el tècnic?

Z: – Una pregunta una mica allunyada de la part tècnica. Es va dir sobre les pors dels venedors sobre l'atur massiu que vindrà. Hi ha algun tipus de lluita competitiva entre el màrqueting creatiu (aquests nois que van inventar la publicitat de pollastre, la publicitat de Volkswagen, sembla) i els implicats en Big Data (que diuen: ara només recopilarem totes les dades i oferirem publicitat dirigida a tothom)? Com a persona que està directament implicada, quina opinió sobre qui guanyarà: un artista, un tècnic, o hi haurà algun tipus d'efecte sinèrgic?

Arthur Khachuyan: intel·ligència artificial en màrqueting

OH: – Escolta, bé, treballen junts. Els enginyers no creen creativitat. Els que són creatius no inventen un públic. Aquí hi ha una mena de història multidisciplinària. Els veritables problemes ara són per als que s'asseuen i prem botons, per als que fan la "feina del mico", prement el mateix cada dia: aquestes són les persones que desapareixeran.

Però els que analitzin les dades romandran naturalment, però algú ha de processar aquestes dades. Algú haurà d'aconseguir aquests dibuixos, dibuixar-los. Una màquina no pot tenir tanta creativitat! Això és una bogeria total! O com, per exemple, la publicitat viral de Carprice, que, per cert, va funcionar molt bé. Recordeu que hi havia aquest a YouTube: "Ven-lo a Carprice", absolutament boig. Per descomptat, cap xarxa neuronal generarà una història així.
En general, sóc partidari del fet que no siguin les persones les que perdran la feina, sinó que tindran una mica més de temps lliure, i aquest temps lliure el podran dedicar a l'autoeducació.

La publicitat primitiva s'extingirà

Z: - En general, la publicitat que es mostra, els bàners, en general, fins i tot els textos de venda no s'escriuen allà: "Necessites finestres, pren-ho!", "Necessites una altra cosa, pren-ho!", és a dir, no hi ha creativitat en absolut.

OH: – Aquesta publicitat s'apagarà, és clar, tard o d'hora. S'apagarà no tant pel desenvolupament de la tecnologia, sinó pel desenvolupament de tu i jo.

És millor barrejar allò rellevant amb allò irrellevant

Z: - Estic aquí! Tinc una pregunta sobre l'experiment que vau dir que no us va funcionar (amb el sistema de recomanació). Segons la teva opinió, el problema és el que s'hi va signar, per què es recomana, o és que tot allò que l'usuari va veure li semblava rellevant? Com que vaig llegir un experiment per a mares, i encara no hi havia tantes dades, i no hi havia tantes dades d'Internet, només hi havia dades d'una botiga de queviures que va predir l'embaràs (que serien mares). I quan van ensenyar una selecció de productes per a dones embarassades, les mares es van horroritzar d'haver-los assabentat abans de qualsevol cosa oficial. I no va funcionar. I per resoldre aquest problema, van barrejar deliberadament productes rellevants amb alguna cosa completament irrellevant.

Arthur Khachuyan: intel·ligència artificial en màrqueting

OH: "Vam mostrar específicament a la gent la base sobre la qual es van fer les recomanacions per entendre els seus comentaris. De fet, aquí va néixer el concepte que no cal dir a la gent que es tracta d'uns productes súper rellevants per a ell.

Sí, per cert, hi ha un enfocament per barrejar-los amb altres irrellevants. Però hi ha el contrari: de vegades la gent entra i interactua amb aquest producte irrellevant: es produeixen anomalies aleatòries, els models es trenquen i les coses es compliquen encara més. Però això realment existeix. A més, moltes empreses deliberadament, si saben que algú està processant les seves dades (algú els podria robar aquesta sortida), de vegades ho barregen perquè després puguin demostrar que no heu pres les dades del seu sistema de recomanació, sinó de l'anomenat Yandex.Market.

Bloquejadors d'anuncis i seguretat del navegador

Z: - Hola. Heu esmentat Ghostery i Adblock. Ens pots dir com d'efectius són aquests rastrejadors en general (potser basant-se en estadístiques)? I tens alguna comanda d'empreses: diuen, assegureu-vos que Adblock no pugui tancar la nostra publicitat.

OH: – No contactem directament amb les plataformes de publicitat, precisament perquè no demanin que la seva publicitat sigui visible per a tothom. Jo personalment faig servir Ghostery: crec que és una extensió molt interessant. Ara tots els navegadors lluiten per la privadesa: Mozilla ha llançat un munt d'actualitzacions de tot tipus, Google Chrome ara és molt segur. Tots bloquegen tot el que poden. "Safari" fins i tot ha desactivat "Gyroscope" per defecte.
I aquesta tendència, és clar, és bona (no per als que recullen dades, tot i que també en van sortir), perquè la gent primer va bloquejar les galetes. Tots els propietaris de xarxes publicitàries recordaven una tecnologia tan meravellosa com les empremtes dactilars del navegador: es tracta d'algorismes que reben 60 paràmetres diferents (resolució de pantalla, versió, tipus de lletra instal·lats) i a partir d'ells calculen un "ID" únic. Passem a això. I els navegadors van començar a lluitar amb això. En general, aquesta serà una batalla interminable dels titans.

L'últim desenvolupador Mozilla és bastant segur. No estalvia pràcticament cap galeta i estableix una vida útil curta. Sobretot si activeu "Incògnit", ningú us trobarà. La pregunta és que serà inconvenient introduir contrasenyes a tots els serveis.

On funciona i no funciona el psicotipat i la fesomia?

Z: – Arthur, moltes gràcies per la conferència. També m'agrada seguir les teves conferències a YouTube. Heu esmentat que els venedors recorren cada cop més a l'ús del psicotipat i la fisonomia. La meva pregunta és: en quines categories de marca funciona això? La meva creença és que això només és adequat per a FMCG. Per exemple, triar un cotxe és...

OH: – Puc descarregar-me on funciona exactament. Això funciona en tot tipus d'històries com "Amediateka", sèries de televisió, pel·lícules, etc. Això funciona bé en bancs i productes bancaris, si no és el segment premium, sinó tot tipus de carnets d'estudiant, plans a terminis, aquest tipus de coses. Això realment funciona molt bé en FMCG i tot tipus d'iPhones, carregadors, tota aquesta merda. Això funciona bé en productes "mare i pop". Encara que sé que a la pesca (hi ha un tema així)... Hi ha hagut casos amb pescadors diverses vegades, mai es poden segmentar de manera fiable. No sé perquè. Una mena d'error estadístic.

Això no funciona bé amb els motoristes, amb joies o amb alguns articles per a la llar. De fet, no funciona bé amb coses sobre les quals la gent no escriuria mai a les xarxes socials; podeu comprovar-ho d'aquesta manera. Convencionalment, amb la compra d'una rentadora: aquí és com entendre qui té una rentadora i qui no? Sembla que tothom en té. Podeu utilitzar les dades de l'OFD: veure qui ha comprat què amb els rebuts i fer coincidir aquestes persones amb els rebuts. Però de fet, hi ha coses de les quals mai no parlaríeu, per exemple, a Instagram: és difícil treballar amb aquestes coses.

Les màquines reconeixen els trucs com a farciment estadístic.

Z: – Tinc una pregunta sobre l'orientació. És possible (o existeixen de sobte) un personatge aleatori condicional que es contradiu en tot: primer busca a Google “els millors gimnasos”, i després busca a Google “10 maneres de no fer res”? I així és en tot. L'orientació pot fer un seguiment d'alguna cosa que es contradiu a si mateixa?

OH: – L'única pregunta aquí és aquesta: si fa 2 anys que utilitzeu Google, li heu dit tot el que podeu sobre vosaltres mateixos i ara instal·leu un connector per a vosaltres mateixos que escrigui consultes aleatòries similars, llavors, per descomptat, a partir de les estadístiques ser capaç d'entendre - el que esteu fent ara és un valor atípic estadístic, i tot això és qüestió de tamisar. Si voleu, registreu un compte nou, però el volum de publicitat no canviarà. Ella només es tornarà estranya. Encara que encara és estranya.

Alguns anuncis 🙂

Gràcies per quedar-te amb nosaltres. T'agraden els nostres articles? Vols veure més contingut interessant? Doneu-nos suport fent una comanda o recomanant als amics, Cloud VPS per a desenvolupadors des de 4.99 dòlars, un anàleg únic dels servidors d'entrada, que vam inventar per a vosaltres: Tota la veritat sobre VPS (KVM) E5-2697 v3 (6 nuclis) 10 GB DDR4 480 GB SSD 1 Gbps des de 19 dòlars o com compartir un servidor? (disponible amb RAID1 i RAID10, fins a 24 nuclis i fins a 40 GB DDR4).

Dell R730xd 2 vegades més barat al centre de dades Equinix Tier IV a Amsterdam? Només aquí 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6 GHz 14C 64 GB DDR4 4 x 960 GB SSD 1 Gbps 100 TV des de 199 $ als Països Baixos! Dell R420 - 2x E5-2430 2.2 Ghz 6C 128 GB DDR3 2 x 960 GB SSD 1 Gbps 100 TB - a partir de 99 $! Llegeix sobre Com construir infrastructure corp. classe amb l'ús de servidors Dell R730xd E5-2650 v4 per valor de 9000 euros per un cèntim?

Font: www.habr.com

Afegeix comentari