Arthur Khachuyan: kunstig intelligens i markedsføring

Arthur Khachuyan er en kjent russisk spesialist innen stordatabehandling, grunnlegger av selskapet Social Data Hub (nå Tazeros Global). Partner ved National Research University Higher School of Economics. Utarbeidet og presenterte, sammen med National Research University Higher School of Economics, et lovforslag om Big Data i Federation Council. Han talte ved Curie Institute i Paris, St. Petersburg State University, Federal University under regjeringen i den russiske føderasjonen, på Red Apple, International OpenDataDay, RIW 2016, AlfaFuturePeople.

Foredraget ble spilt inn på friluftsfestivalen «Geek Picnic» i Moskva i 2019.

Arthur Khachuyan: kunstig intelligens i markedsføring

Arthur Khachuyan (heretter – AH): – Hvis fra et stort antall bransjer - fra medisin, fra konstruksjon, fra noe, noe, for å velge den der teknologien for big data, maskinlæring, dyp læring oftest brukes, så er dette sannsynligvis markedsføring. For de siste tre eller så årene er alt som omgir oss i en eller annen form for reklamekommunikasjon nå knyttet nettopp til dataanalyse og nettopp til det som kan kalles kunstig intelligens. Derfor vil jeg i dag fortelle deg om dette fra en så veldig fjern historie ...

Hvis du forestiller deg kunstig intelligens og hvordan den ser ut, er det sannsynligvis noe sånt. Det merkelige bildet er et av de nevrale nettverkene jeg skrev for et år siden for å finne avhengigheten av hva hunden min gjør - hvor mange ganger trenger hun å bli stor, liten, og hvordan avhenger det generelt av hvor mye hun spiser eller ikke? . Dette er en spøk om hvordan kunstig intelligens kan tenkes.

Arthur Khachuyan: kunstig intelligens i markedsføring

Men la oss likevel tenke på hvordan det hele fungerer i reklamekommunikasjon. Det er tre måter moderne algoritmer innen reklame og markedsføring kan samhandle med oss ​​på. Det er tydelig at den første historien er rettet mot å skaffe og hente ut ytterligere kunnskap om deg og meg, for så å bruke den til noen gode og ikke så gode formål; tilpasse tilnærmingen til hver spesifikk person; Naturligvis, etter dette, skape en viss etterspørsel for å utføre hovedmålhandlingen og gjennomføre et visst salg.

Ved hjelp av teknologi prøver de å løse problemet med effektiv kommunikasjon

Hvis jeg forteller deg å tenke på hva Pornhub og M. Video», hva tenker du?

Kommentarer fra salen (heretter kalt C): – TV, publikum.

ÅH: – Mitt konsept er at dette er to steder folk kommer for en bestemt type tjenester, eller la oss kalle det en bestemt type varer. Og dette publikummet er annerledes ved at det ikke ønsker å fortelle selgeren noe. Hun ønsker å komme inn og få det som interesserer henne i en eksplisitt eller implisitt form. Naturligvis kommer ingen til M. Video” ønsker ikke å kommunisere med noen selgere, ønsker ikke å forstå, ønsker ikke å svare på noen av spørsmålene deres.

Derfor følger den første historien av alt dette.

Når teknologier for å skaffe tilleggskunnskap dukket opp for på en eller annen måte å unngå å kommunisere med en person. Vi elsker alle det når vi ringer banken og banken sier til oss: «Hei. Alexey, du er vår VIP-klient. Nå vil en eller annen supersjef snakke med deg.» Du kommer til denne banken, og det er virkelig en unik leder som kan snakke med deg. Dessverre eller heldigvis har ikke en eneste bedrift ennå funnet ut hvordan de skal ansette tusen personlige ledere for tusen kunder; og siden de fleste av disse menneskene nå er online, er oppgaven å forstå hva slags person dette er og hvordan man kan kommunisere med ham riktig før han kommer til en eller annen reklameressurs. Og derfor har det faktisk dukket opp teknologier som prøver å løse dette problemet.

Datautvinning er den nye oljen

La oss forestille oss at du er eieren av en blomsterbod. Tre personer kommer for å se deg. Den første står veldig lenge, nøler, prøver å snakke med deg, tar en slags bukett - du går for å pakke den inn, går ut for å gjøre noe der; han løper fra boden med denne buketten - du har mistet dine tre tusen rubler. Hvorfor skjedde det? Du vet ikke noe om denne personen: du kjenner ikke hans historie med arrestasjoner i innenriksdepartementet, du vet ikke at han er en kleptoman og er registrert i en psykiatrisk dispensary. Hvorfor? For du så det for første gang, og du er ikke en atferdsanalytiker.

Noen andre kommer... Vitaly. Vitaly bruker også veldig lang tid på å finne ut av det, sier han, "Vel, jeg trenger det og det." Og du sier til ham: "Blomster til mamma, ikke sant?" Og du selger ham en bukett.

Konseptet her er å finne ut nok data til å forstå hva personen faktisk trenger. Alle tenkte umiddelbart på en slags annonsenettverk og så videre...

Alle har sikkert hørt den dumme setningen om at "data er den nye oljen" mer enn en gang? Det har sikkert alle hørt. Faktisk har folk lært å samle inn data for ganske lenge siden, men å trekke ut data fra disse dataene er oppgaven som kunstig intelligens i markedsføring, eller en slags statistiske algoritmer, nå prøver å løse. Hvorfor? For hvis du snakker med en person, kan han gi deg et riktig, galt eller på en eller annen måte farget svar. Vitsen jeg forteller elevene mine er hvordan undersøkelser skiller seg fra statistikk. Jeg skal fortelle deg dette som en anekdote:

Dette betyr at de i to landsbyer bestemte seg for å gjennomføre en undersøkelse om gjennomsnittlig manndomslengde. Dette betyr at i den første landsbyen, Villaribo, er gjennomsnittslengden 15 centimeter, i landsbyen Villabaggio - 25. Vet du hvorfor? For det ble utført målinger i den første landsbyen, og en undersøkelse ble utført i den andre.

Pornoindustrien er flaggskipet for anbefalingssystemer

Dette er grunnen til at den moderne tilnærmingen er å analysere alle mennesker uten unntak, selv om de er litt mindre enn 100 %, men det er disse menneskene du ikke trenger å spørre, du trenger ikke å se på dem. Det er nok å analysere det som nå kalles et digitalt fotavtrykk for å forstå hva denne personen trenger, hvordan man snakker til ham riktig, hvordan man på riktig måte skaper etterspørsel rundt ham. På den ene siden er dette en tankeløs maskin (men du og jeg vet dette veldig godt); vi ønsker ikke å kommunisere med folk fra M. Video," og enda mer, når vi går til ressurser som Pornhub, ønsker vi å få akkurat det vi trenger.

Hvorfor snakker jeg alltid om Pornhub? Fordi voksenindustrien er den første som kommer til analyse av slike teknologier, til implementering av slike teknologier, til dataanalyse. Hvis du tar de tre mest populære bibliotekene i dette området (for eksempel TensorFlow eller Pandas for Python, for behandling av CSV-filer og så videre), hvis du åpner det på Github, med en kort Google over alle disse navnene vil du finne en et par personer som enten jobbet eller jobber i Pornhub-selskapet, og var de første som implementerte anbefalingssystemer der. Generelt er denne historien veldig avansert, og viser hvor mye dette publikummet, hvor mye dette selskapet har beveget seg fremover.

Arthur Khachuyan: kunstig intelligens i markedsføring

Tre nivåer av identifikasjon

Det er et stort sett med data rundt en person som kan identifiseres. Jeg pleier å dele dette formelt inn i tre nivåer, og går dypere og dypere. Naturligvis har selskapet sine egne data.

Hvis, for eksempel, vi snakker om å bygge et anbefalingssystem, er det første nivået dataene som ligger i selve butikken (kjøpshistorikk, alle typer transaksjoner, hvordan en person interagerte med grensesnittet).

Deretter er det et nivå (relativt det største) - dette er det som kalles åpne kilder. Ikke tro at jeg oppfordrer deg til å skrape sosiale nettverk, men faktisk åpner det som er tilgjengelig i åpne kilder opp et stort sett med data som du for eksempel kan lære om en person.

Og den tredje hoveddelen er miljøet til denne personen selv. Ja, det er en oppfatning at hvis en person ikke er på sosiale nettverk, er det ingen data om ham der (du vet sikkert allerede at dette ikke er sant), men det viktigste er at dataene som er på en persons profil (eller i noen applikasjoner) er bare 40% av kunnskapen som kan oppnås om det. Resten av informasjonen hentes fra hans miljø. Uttrykket "fortell meg hvem din venn er, og jeg skal fortelle deg hvem du er" får en ny betydning i det XNUMX. århundre fordi en enorm mengde data kan fås rundt den personen.

Hvis vi snakker nærmere reklamekommunikasjon, så er det å motta reklamekommunikasjon ikke fra reklame, men fra en venn, bekjent eller på en eller annen måte verifisert person en veldig kul funksjon som mange markedsførere bruker. Når en applikasjon plutselig gir deg en gratis kampanjekode, lager du et innlegg om det og tiltrekker deg dermed et nytt publikum. Faktisk ble ikke denne kampanjekoden for den betingede "Yandex.Taxi" valgt tilfeldig, men for dette ble en enorm mengde data analysert om potensialet ditt til å tiltrekke seg et nytt publikum og på en eller annen måte samhandle med dem.

Arthur Khachuyan: kunstig intelligens i markedsføring

De analyserer til og med oppførselen til TV-seriekarakterer

Jeg skal vise deg tre bilder, og du forteller meg hva forskjellen er mellom dem.

Denne:

Arthur Khachuyan: kunstig intelligens i markedsføring

Dette:

Arthur Khachuyan: kunstig intelligens i markedsføring

Og denne:

Arthur Khachuyan: kunstig intelligens i markedsføring

Hva er forskjellen mellom dem? Alt er enkelt her. Som i kvantemekanikk, i dette tilfellet ble denne kreativiteten dannet av observatøren. Det vil si at forskjellen i den samme reklamekampanjen, utført av samme merke på samme tid, er bare i hvem som så denne reklamen. Personlig, når jeg går til Amediateka, viser de fortsatt Khal Drogo. Jeg vet ikke hva Amediateka tenker om mine preferanser, men av en eller annen grunn skjer dette.

Det som nå kalles personlig kommunikasjon er den mest populære historien om å tiltrekke seg et publikum og samhandle med det på riktig måte. Hvis vi på det første stadiet identifiserte personer som bruker våre egne merkevaredata, åpen kildekodedata og for eksempel data fra denne personens miljø, kan vi, etter å ha analysert ham, forstå hvem han er, hvordan vi kan snakke med ham riktig og, viktigst av alt, , hvilket språk han snakker snakk til ham.

Her har teknologien gått så langt at karakterene i TV-serier som folk ser nå blir analysert. Det vil si at du liker TV-serier - de [liker] blir sett, de ser på hvem du har interaksjon med der, for å forstå hva slags person som passer deg å samhandle med. Det høres ut som fullstendig tull, men bare for moro skyld, prøv det på en av ressursene - forskjellige mennesker ser forskjellige reklamer (for å samhandle med det riktig).

Ikke et eneste moderne medie eller noen videoressurs viser deg bare noen nyheter. Gå til media - et stort antall algoritmer er lastet inn som identifiserer deg, forstår all din tidligere aktivitet, appellerer til den matematiske modellen og viser deg noe. I dette tilfellet er det en så merkelig historie.

Hvordan bestemmes behov? Psykometri. Fysiognomi

Det er mange (ekte) tilnærminger til å bestemme en persons faktiske behov og hvordan man kan kommunisere med dem på riktig måte. Det er mange tilnærminger, alt løses annerledes, det er umulig å si hva som er bra og hva som er dårlig. De viktigste ser ut til å vite alt.

Arthur Khachuyan: kunstig intelligens i markedsføring

Psykometri. Etter historien med Cambridge Analytics tok det en slags sjokkerende, etter min mening, en slags vending, fordi annenhver politisk bedrift nå kommer og sier: «Å, kan du få meg til å like Trump? Jeg vil også vinne, og så videre.» Faktisk er dette selvfølgelig tull for våre realiteter, for eksempel politiske valg. Men for å bestemme psykotyper, brukes tre modeller:

  • den første er basert på innholdet du bruker – ordene du skriver, noe informasjon du liker, videoer osv.;
  • den andre er knyttet til hvordan du interagerer med nettgrensesnittet, hvordan du skriver, hvilke knapper du trykker på – ja, det er hele selskaper som, basert på tastaturhåndskriften deres, ganske pålitelig kan bestemme det som nå kalles psykotyper.
  • Jeg er ikke så mye psykolog, jeg forstår ikke helt hvordan det fungerer, men fra et annonsekommunikasjonssynspunkt fungerer publikum delt inn i disse segmentene veldig bra, fordi noen trenger å bli vist en rød skjerm med en blå kvinne, noen må vises en mørk skjerm - blå bakgrunn med en slags abstraksjon, og det fungerer veldig kult. På noen lave nivåer - så mye at en person ikke engang tenker på det. Hva er hovedproblemet i annonsemarkedet nå? Alle er en etterretningsagent, alle gjemmer seg, alle har en million tusen nettlesertillatelser installert, for ikke å bli identifisert på noen måte - du har sannsynligvis "Adblocks", "Gostrey" og alle slags applikasjoner som blokkerer sporing. På grunn av dette er det veldig vanskelig å forstå noe om en person. Og teknologien har gått videre - du må ikke bare vite at denne personen har returnert til nettstedet ditt for 125. gang, men at han også er en sånn og en merkelig person.

Fysiognomi er en veldig kontroversiell vitenskap. Det regnes ikke engang som vitenskap. Dette er en gruppe mennesker som pleide å programmere løgndetektorer for et eller annet innenriksdepartement, og nå er engasjert i det som kalles personifiseringen av kreativitet. Tilnærmingen her er veldig enkel: flere av dine offentlige fotografier er tatt fra noen sosiale nettverk, og tredimensjonal geometri er bygget fra dem. Og hvis du er advokat, vil du nå si at dette er en person og personopplysninger; men jeg skal fortelle deg at dette er 300 tusen punkter som ligger i verdensrommet, og dette er ikke en person, og er ikke personlige data. Dette er hva alle vanligvis sier når Roskomnadzor kommer til dem.

Men seriøst, ansiktet ditt separat, hvis for- og etternavnet ditt ikke er signert der, er ikke dine personlige data. Poenget er at gutta markerer ulike ansiktstrekk som påvirker hvordan en person tar avgjørelser og hvordan de skal samhandle med ham på riktig måte. I noen områder fungerer dette dårlig, i noen annonsesegmenter; i hvilke segmenter fungerer det veldig bra. Til slutt viser det seg at når du går til en ressurs, ser du ikke bare ett banner som vises til alle, men for eksempel... nå er det normalt å lage 16 eller 20 alternativer for forskjellige målgrupper - og det fungerer veldig kult. Ja, dette er enda tristere fra forbrukerens synspunkt, fordi folk begynner å bli manipulert mer og mer. Men ikke desto mindre, fra et forretningsmessig synspunkt fungerer det veldig bra.

Den svarte boksen for maskinlæring

Dette gir opphav til følgende problem med slike teknologier: Tross alt, for de fleste utviklere nå er det som kalles dyp læring en "svart boks". Hvis du noen gang har vært fordypet i denne historien og snakket med utviklerne, sier de alltid: «Å, hør, vel, vi har kodet noe så uforståelig der, og vi vet ikke hvordan det fungerer.» Kanskje noen har opplevd dette.

Dette er faktisk langt fra sant. Det som nå kalles maskinlæring er langt fra en «black box». Det er et stort antall tilnærminger for å beskrive inn- og utdataene, og til slutt kan selskapet forstå grundig på grunnlag av hvilke tegn maskinen bestemte seg for å vise deg denne pornografiske videoen eller en annen. Spørsmålet er at ingen av selskapene noen gang røper dette, fordi: for det første er det en forretningshemmelighet; for det andre vil det være en enorm mengde data som du ikke engang visste om.

For eksempel, før dette, i en diskusjon om etikk, diskuterte vi hvordan sosiale nettverk analyserer personlige meldinger for å merke folk i en slags reklamehistorier. Hvis du skriver noe til noen, får du basert på dette en spesifikk kode for faktisk en eller annen form for reklamekommunikasjon. Og du vil aldri bevise det, og det er nok ingen vits i å bevise det. Men hvis lignende mønstre ble avslørt, ville de eksistere. Det viser seg at markedet for å bygge slike anbefalingssystemer later som om de ikke vet hvorfor dette skjedde.

Folk vil ikke vite hva folk vet om dem

Og den andre historien er at klienten aldri vil vite hvorfor han mottok akkurat denne annonsen, akkurat dette produktet. Jeg skal fortelle deg denne historien. Min første erfaring med kommersiell implementering av anbefalingssystemer basert på lignende algoritmer nettopp for forskningens skyld var i 2015 i et veldig stort nettverk av sexbutikker (ja, heller ikke en spesielt ubehagelig historie).

Arthur Khachuyan: kunstig intelligens i markedsføring

Kunder ble tilbudt følgende: de kommer inn, logger på med sitt sosiale nettverk, og etter omtrent 5 sekunder mottar de en helt personlig butikk for dem, det vil si at alle produktene har endret seg - de faller inn i en bestemt kategori, og så videre . Vet du hvor mye konverteringsfrekvensen til denne butikken har økt? Ikke på noen måte! Folk kom inn og løp fra det umiddelbart. De kom inn og innså at de ble tilbudt akkurat det de tenkte på...

Problemet med denne testen var at det under hvert produkt stod skrevet hvorfor du ble tilbudt akkurat det ("fordi du er medlem av den skjulte gruppen "Kraftfull kvinne leter etter en mann som er en dørmatte"). Derfor viser moderne anbefalingssystemer aldri dataene som "prediksjonen" ble laget på grunnlag av.

En veldig populær historie er media fordi de alle bruker lignende anbefalingssystemer. Tidligere var algoritmene veldig enkle: se på kategorien "Politik" - og de viser deg nyheter fra kategorien "Politik". Nå er alt så komplisert at de analyserer stedene der du stoppet musen, hvilke ord du konsentrerte deg om, hva du kopierte, hvordan du generelt samhandlet med denne siden. Deretter analyserer han vokabularet til selve meldingene: ja, du leser ikke bare nyheter om Putin, men på en bestemt måte, med en viss følelsesmessig farge. Og når en person mottar noen nyheter, tenker han ikke engang på hvordan han kom hit. Likevel samhandler han da med dette innholdet.

Alt dette er naturligvis rettet mot å holde den stakkars, uheldige lille mannen som allerede er i ferd med å bli gal av den enorme mengden informasjon som er rundt ham. Her må det sies at det ville vært fint å bruke slike systemer for å personliggjøre det kreative rundt deg og samle inn litt informasjon, men dessverre er det ingen slike tjenester ennå.

Kunstig intelligens fanger klienten i luften og skaper etterspørsel

Og her dukker det opp et veldig interessant filosofisk spørsmål, som går fra å lage et anbefalingssystem til å skape etterspørsel. Sjelden noen tenker på det, men når du prøver å spørre den såkalte Instagram, «Hvorfor samler du inn data? Hvorfor ikke vise meg absolutt tilfeldig reklame?" - Instagram vil fortelle deg: "Venn, alt dette er gjort for å vise deg nøyaktig hva som er interessant for deg." Vi ønsker å kjenne deg så nøyaktig at vi kan vise deg akkurat det du leter etter.

Arthur Khachuyan: kunstig intelligens i markedsføring

Men teknologien har for lengst krysset denne forferdelige terskelen, og lignende teknologier forutsier ikke lenger hva du trenger. De (oppmerksomhet!) skaper etterspørsel. Dette er nok det skumleste som dreier seg om kunstig intelligens i slik kommunikasjon. Det skumle er at det har blitt brukt nesten overalt de siste 3-5 årene - fra Google-søkeresultater til Yandex-søkeresultater, til noen systemer... Ok, jeg vil ikke si noe dårlig om Yandex; og bra.

Hva er poenget? Det er lenge siden slik reklamekommunikasjon har beveget seg bort fra strategien der du skriver «Jeg vil kjøpe et barnesete» og ser hundre tusen millioner publikasjoner. De gikk videre til følgende: så snart kvinnen la ut et bilde med en knapt synlig mage, begynte mannen hennes umiddelbart å bli fulgt av meldinger: «Mann, fødselen kommer snart. Kjøp et barnesete."

Her kan du med rimelighet spørre, hvorfor, med slike gigantiske fremskritt innen teknologi, ser vi fortsatt så dårlig reklame på sosiale nettverk? Problemet er at i dette markedet er alt fortsatt avgjort av penger, så i et fint øyeblikk kan en annonsør som Coca-Cola komme og si: «Her er 20 millioner til deg – vis de drittsekkere bannerne mine til hele Internett.» Og de vil virkelig gjøre det.

Men hvis du lager en slags ren konto og tester hvor nøyaktig slike algoritmer gjetter deg: de prøver først å gjette deg, og så begynner de å gjøre noe med deg på forhånd. Og den menneskelige hjernen fungerer på en slik måte at når den mottar informasjon som er pålitelig for den, behandler den ikke engang øyeblikket hvorfor den mottok denne informasjonen. Den første regelen for å fastslå at du er i en drøm er å forstå hvordan du kom hit. En person husker aldri øyeblikket han havnet i et bestemt rom. Det er det samme her.

Google kan begynne å forme ditt verdensbilde

Slike studier ble utført av flere utenlandske selskaper som driver med i-sporing. De installerte enheter på spesielle datamaskiner som registrerer hvor testpersonens øyne ser. Jeg tok fra fem til syv tusen frivillige som ganske enkelt scrollet i feeden, samhandlet med sosiale nettverk, med reklame, og de registrerte informasjon om hvilke deler av bannerne og reklamene disse menneskene stoppet øynene på.

Og det viser seg at når folk mottar en slik hyperpersonlig kreativ, tenker de ikke engang på det - de går umiddelbart videre, begynner å samhandle med det. Fra et forretningsmessig synspunkt er dette bra, men fra synspunktet til oss som brukere er dette ikke veldig kult, for - hva er de redde for? – At den betingede «Google» i et vakkert øyeblikk kan begynne (eller, selvfølgelig, kanskje ikke begynne) å danne sitt eget verdensbilde. I morgen kan han for eksempel begynne å vise folk nyheter om at jorden er flat.

Bare tuller, men de har blitt tatt så mange ganger at de under valg begynner å gi visse opplysninger til visse personer. Vi er alle vant til at søkemotoren får alt ærlig. Men, som jeg alltid sier, hvis du virkelig vil vite hvordan verden fungerer, skriv din egen søkemotor, uten filtre, uten å ta hensyn til opphavsrett, uten å rangere noen av vennene dine i søkeresultatene. Visningen av ekte data på Internett er generelt forskjellig fra det som vises av Google, Yandex, Bing og så videre. Noen materialer er skjult fordi venner, kolleger, fiender eller noen andre (eller en tidligere kjæreste som du sov med) - det spiller ingen rolle.

Hvordan Trump vant

Da det var siste valg i USA, ble det utført en veldig enkel studie. De tok de samme forespørslene på forskjellige steder, fra forskjellige IP-adresser, fra forskjellige byer, forskjellige mennesker Googlet det samme. Konvensjonelt var forespørselen i stil med: hvem vil vinne valget? Og utrolig nok ble resultatene konstruert på en slik måte at i de statene der det største antallet mennesker prøvde å stemme på feil kandidat, fikk de noen gode nyheter om kandidaten som Google promoterte. Hvilken? Vel, det er klart hvilken – den som ble president. Dette er en helt ubeviselig historie, og alle disse studiene er en finger i vannet. Google kan si: «Gutter, alt dette er gjort for at vi skal vise det mest relevante innholdet for dere».

Fra nå av bør du vite at det som kalles maksimalt relevant, absolutt ikke er tilfelle. Selskapet kaller relevant noe som må selges til deg av en eller annen god eller dårlig grunn.

De som ikke har penger nå, forberedes allerede på fremtidige kjøp

Det er et annet interessant poeng her som jeg vil fortelle deg om. Et stort antall aktive publikummere nå på sosiale nettverk og i apper er unge mennesker. La oss kalle det dette - insolvent ungdom: barn 8-9 år som spiller idiotiske spill, disse er 12-13-14 som bare registrerer seg på sosiale nettverk. Hvorfor skulle store selskaper bruke enorme budsjetter og ressurser på å lage applikasjoner for et ikke-betalende publikum som aldri tjener penger? I det øyeblikket når denne målgruppen blir solvent, vil det være tilstrekkelig mengde data om den til å forutsi oppførselen veldig godt.

Arthur Khachuyan: kunstig intelligens i markedsføring

Spør nå enhver målolog, hva er den vanskeligste målgruppen? De vil si: svært lønnsomt. Fordi å selge for eksempel en leilighet verdt 150 millioner rubler gjennom sosiale nettverk er nesten umulig. Det er isolerte tilfeller når du gjør en slags reklame for 10 tusen mennesker, en kjøper denne leiligheten - klienten er en suksess... Men en av ti tusen, fra et statistisk synspunkt, er fullstendig dritt. Så hvorfor er det vanskelig å identifisere et publikum med høy inntekt? Fordi menneskene som nå er medlemmer av et svært lønnsomt publikum ble født da Internett fortsatt var veldig lite, da ingen kjente Artemy Lebedev ennå, og det er ingen informasjon om dem. Det er umulig å forutsi deres atferdsmønster, det er umulig å forstå hvem deres opinionsledere er, og fra hvilke innholdskilder de mottar.

Så når dere alle blir milliardærer om 25 år, og selskapene som skal selge dere noe, vil ha en enorm mengde data. Det er derfor vi nå har en fantastisk GDPR i Europa som forhindrer innsamling av data fra mindreårige.

Dette fungerer naturligvis ikke i det hele tatt i praksis, siden alle barna fortsatt spiller på mors og fars kontoer - det er slik informasjon samles inn. Neste gang du gir barnet et nettbrett, tenk på dette.

Absolutt ikke noen skummel, dystopisk fremtid, når alle vil dø i en krig med maskiner - en helt ekte historie nå. Det er et stort antall selskaper som lager algoritmer for psykoprofilering av mennesker basert på hvordan de spiller spill. En veldig interessant bransje. Basert på alt dette blir folk deretter segmentert for på en eller annen måte å kommunisere med dem.

Arthur Khachuyan: kunstig intelligens i markedsføring

Forutsigelse av oppførselen til disse menneskene vil være tilgjengelig om 10-15 år - nettopp i det øyeblikket de blir et solvent publikum. Det viktigste er at disse menneskene allerede har gitt tillatelse på forhånd til å behandle personopplysningene deres, overføre dem til tredjeparter, og alt dette er lykke, og så videre.

Hvem vil miste jobben?

Og min siste historie er at alle alltid spør hva som vil skje om 50 år: vi vil alle dø, det blir arbeidsledighet for markedsførere... Det er markedsførere her som er bekymret for arbeidsledighet, ikke sant? Generelt er det ingen grunn til bekymring, fordi enhver høyt kvalifisert person vil ikke miste jobben.

Arthur Khachuyan: kunstig intelligens i markedsføring

Uansett hvilke algoritmer som lages, uansett hvor tett maskinen kommer nær det vi har her (peker på hodet hans), hvis den utvikler seg raskt nok, vil slike mennesker aldri stå stille, fordi noen må lage disse kreative tingene gjøre. Ja, det er alle slags "gans" som tegner bilder som ser ut som mennesker og skaper musikk, men det er fortsatt usannsynlig at folk i dette området noen gang vil miste jobben.

Arthur Khachuyan: kunstig intelligens i markedsføring

Jeg har alt med historien, så du kan stille spørsmål hvis du har flere. Takk skal du ha.

Arthur Khachuyan: kunstig intelligens i markedsføring

moderator: – Venner, vi går nå videre til «Spørsmål og svar»-blokken. Du rekker opp hånden - jeg kommer bort til deg.

Arthur Khachuyan: kunstig intelligens i markedsføring

Spørsmål fra salen (XNUMX): – Spørsmål om den "svarte boksen". De sa at det var mulig å spesifikt forstå hvorfor et slikt og et slikt resultat ble oppnådd for en slik og slik bruker. Er dette en slags algoritmer, eller må det analyseres hver gang for hver modell ad hoc (forfatterens notat: "spesielt for dette" - en latinsk fraseologisk enhet)? Eller finnes det ferdige for et slags nevrale nettverk som grovt sett kan gi forretningsmessig mening?

ÅH: – Her må du forstå følgende: det er et stort antall oppgaver innen maskinlæring. For eksempel er det en oppgave - regresjon. For regresjon trengs ingen nevrale nettverk i det hele tatt. Alt er enkelt: du har flere indikatorer, du må beregne følgende. Det er oppgaver hvor det er nødvendig å ty til noe slikt som dyp læring. Faktisk, i dyp læring er det vanskelig å pålitelig forstå hvilke vekter som ble tildelt hvilke nevroner, men juridisk sett er alt du trenger å forstå hvilke data som var ved inngangen og hvordan de spilte ut ved utgangen. Dette er juridisk nok til å patentere en slik avgjørelse, og det er nok til å forstå på hvilket grunnlag historien ble laget.

Det er ikke slik at du gikk til siden og ble vist en slags banner fordi du tok et bilde med rødt hår på Instagram for to måneder siden. Hvis utvikleren ikke inkluderer innsamlingen av disse dataene og merkingen av hårfarge i denne modellen, vil den ikke komme ut av ingensteds.

Hvordan selge resultatene av maskinlæringssystemer?

Z: – Det er bare et spørsmål om hva: nøyaktig hvordan forklare, hvordan selge til noen som ikke forstår maskinlæring. Jeg vil si: modellen min fører helt klart fra hårfarge til... vel, hårfargeendringer... Er dette mulig eller ikke?

Arthur Khachuyan: kunstig intelligens i markedsføring

ÅH: - Kanskje ja. Men fra et salgssynspunkt vil den eneste ordningen fungere: du har en reklamekampanje, vi erstatter publikum med den som genereres av maskinen - og du ser bare resultatet. Dette er dessverre den eneste måten å pålitelig overbevise kunden om at en slik historie fungerer, fordi det er mange løsninger på markedet som en gang ble implementert og ikke fungerte.

Om å skape en virtuell personlighet

Z: - Hallo. Takk for foredraget. Spørsmålet er: hvilken sjanse har en person, som av en eller annen grunn ikke ønsker å følge ledelsen av maskinlæring, til å skape for seg selv en virtuell personlighet som er radikalt forskjellig fra sin egen personlighet, gjennom interaksjon med grensesnittet eller for noen annen grunn?

Arthur Khachuyan: kunstig intelligens i markedsføring

ÅH: – Det er en haug med forskjellige plugins som omhandler spesifikt randomiseringsadferd. Det er en kul ting - Ghostery, som etter min mening nesten skjuler deg for en haug med forskjellige trackere som ikke kan registrere denne informasjonen. Men faktisk, nå er alt du trenger en lukket profil på sosiale nettverk slik at ingen, ingen onde skrapere, kan samle noe der. Det er nok bedre å installere en slags utvidelse eller skrive noe selv.

Du skjønner, konseptet her er at juridisk, for eksempel, personlig data refererer til data som du kan identifiseres med, og loven gir som et eksempel bostedsadressen din, alder og så videre. I dag er det utallige datamengder som du kan identifisere deg med: samme tastaturhåndskrift, samme trykk, nettleserens digitale signatur... Før eller siden gjør en person en feil. Han kan være et sted på en "kafé" ved å bruke "Thor", men til slutt, i et fint øyeblikk, vil enten VPN-en glemme å slå på, eller noe annet, og i det øyeblikket kan han identifiseres. Så den enkleste måten er å opprette en privat konto og installere en utvidelse.

Markedet beveger seg mot et punkt hvor du bare trenger å trykke på én knapp for å få resultater.

Z: - Takk for historien. Som alltid, alltid veldig interessant (jeg følger deg). Spørsmålet er: hvilken fremgang er det når det gjelder å lage systemer som er positive for brukerne, anbefalingssystemer? Du sa at du en gang jobbet med et anbefalingssystem for å finne en seksuell partner, en venn i livet (eller musikk som en person potensielt kunne like)... Hvor lovende er alt dette, og hvordan ser du utviklingen fra det synspunktet om å lage systemer som folk trenger?

ÅH: – Generelt beveger markedet seg til et punkt hvor folk må trykke på én knapp og umiddelbart få det de trenger. Når det gjelder min erfaring med å lage datingapplikasjoner (forresten, vi vil relansere det på slutten av året), i tillegg til at 65% var gifte menn, var det vanskeligste anbefalingsproblemet at en person ble tilbudt flere modeller ved starten av søknaden - "Vennskap", "Sex", "Sexvennskap" og "Forretning". Folk valgte ikke det de trengte. Menn kom og valgte "Kjærlighet", men i virkeligheten kastet de nakenhet på alle, og så videre.

Problemet var å identifisere en person som ikke passer til en av disse modellene, og på en eller annen måte jevnt ta ham og flytte ham i den andre retningen. På grunn av den lille datamengden er det svært vanskelig å avgjøre om dette er en feil i prognosealgoritmen, eller om en person ikke er i hans kategori. Det er det samme med musikk: det er nå svært få virkelig verdige algoritmer som kan "facaste" musikk godt. Kanskje «Yandex.Music». Noen synes Yandex.Music-algoritmen er dårlig. For eksempel liker jeg henne. Jeg personlig, for eksempel, liker ikke YouTube-musikkalgoritmen og så videre.

Det er selvfølgelig noen finesser - alt er knyttet til lisenser... Men i virkeligheten er etterspørselen etter slike systemer ganske høy. På en gang var Retail Rocket-selskapet kjent, som var involvert i implementeringen av anbefalingssystemer, men nå går det på en eller annen måte ikke særlig bra - tilsynelatende fordi de ikke utviklet algoritmene sine på lenge. Alt går mot dette – til det punktet at vi går inn og uten å trykke på noe, får det vi trenger (og blir helt dumme, fordi vår evne til å velge er helt forsvunnet).

Påvirke markedsføring

Z: - Hallo. Jeg heter Konstantin. Jeg vil stille et spørsmål om påvirkningsmarkedsføring. Kjenner du til noen systemer som lar en bedrift velge en passende blogger for bedriften basert på noen statistiske data og så videre? Og på hvilket grunnlag gjøres dette?

Arthur Khachuyan: kunstig intelligens i markedsføring

ÅH: – Ja, jeg starter langveis fra og umiddelbart si at problemet med alle disse teknologiene er at all denne kunstige intelligensen i markedsføring nå er som en stram rullator: til venstre er det store selskaper som har mye penger, og i i alle fall vil alt være effektivt for deres arbeid fordi deres reklamekampanjer er rettet bare mot visninger; på den annen side er det mange små bedrifter som dette ikke vil fungere for, fordi de har mye data. Så langt er anvendeligheten av disse historiene et sted i midten.

Når det allerede er gode budsjetter, og oppgaven er å behandle disse budsjettene riktig (og i prinsippet er det allerede ganske mye data) ... kjenner jeg et par tjenester, noe som Getblogger, som ser ut til å ha algoritmer. For å være ærlig har jeg ikke studert disse algoritmene. Jeg kan fortelle deg hvilken tilnærming vi bruker for å finne opinionsledere når vi skal gi en gave til noen mødre.

Vi bruker en beregning kalt Content Distribution Time. Det fungerer slik: du tar en person hvis publikum du analyserer, og du må systematisk (for eksempel en gang hvert 5. minutt) samle informasjon om hvert innlegg, hvem som likte det, kommenterte det, og så videre. På denne måten kan du forstå på hvilket tidspunkt hver person i publikum interaksjoner med innholdet ditt. Gjenta denne operasjonen for hver representant for sitt publikum, og ved å bruke beregningen for gjennomsnittlig tid for innholdsspredning, kan den for eksempel farges i en stor nettverksgraf av disse personene og bruke denne beregningen til å bygge klynger.

Dette fungerer ganske bra hvis vi for eksempel ønsker å finne 15 mødre som opprettholder opinionen på noen woman.ru. Men dette er en ganske kompleks teknisk implementering (selv om den rent teoretisk kan gjøres i Python). Poenget er at problemet med påvirkningsmarkedsføring i store reklamebyråer er at de trenger store, kule, dyre bloggere som ikke jobber for dritt. Nå ønsker et bilmerke å selge et produkt gjennom en opinionsleder - de må bruke en bilblogger som en siste utvei, fordi publikum enten allerede har kjøpt en bil, eller vet nøyaktig hva slags bil de vil ha, bare sitter og ser på kule biler. Her er det viktig å ikke gå glipp av analysen av publikum til personen selv.

Markedsføringsroboter

Z: – Fortell meg, hvor mye påvirker roboter på sosiale nettverk innsamlingen av informasjon og dens kvalitet?

Arthur Khachuyan: kunstig intelligens i markedsføring

ÅH: – Det er så interessant med roboter. Billige roboter er ganske enkle å identifisere - enten har de det samme innholdet, eller de er venner med hverandre, eller de er i samme nettverk. Det finnes også tilnærminger til å håndtere komplekse roboter. Eller spør du problemet hvordan man kobler en person til sin falske?

Z: – Hvor høykvalitetsinformasjon blir resultatet med alt dette søppelet?

ÅH: – Her fungerer det på denne måten: På grunn av det faktum at det er en enorm mengde data (for eksempel for en slags markedsundersøkelse), kan alt dette riffet rett og slett kastes ut. Det vil si at det er bedre å kaste ut litt mer ekte mennesker enn å fange bots, fordi det er ubrukelig for dem å vise reklame. Men hvis du samler inn beregninger, for eksempel interaksjoner med bannere eller anbefalingssystemer, kan slike kontoer bli kastet ut.

Nå på sosiale nettverk er det omtrent seks prosent av virtuelle karakterer eller ganske enkelt forlatte sider eller introverte, som algoritmer "matcher" som roboter. Når det gjelder å knytte en person til det falske, er alt her også knyttet til det faktum at personen før eller siden vil gjøre en feil, og saken er at atferdsmodellen er den samme - både hans virkelige konto og hans falske. Før eller siden vil de se det samme innholdet eller noe annet.

Her kommer alt ikke ned til prosentandelen av feil, men til hvor lang tid det tar å identifisere en person pålitelig. For noen som bor med Instagram, kommer denne gangen for pålitelig identifikasjon ned til fem minutter. For noen – med seks til åtte måneder.

Til hvem og hvordan selge data?

Z: - Hallo. Jeg er interessert i å vite hvordan data selges mellom selskaper? For eksempel har jeg en applikasjon der du kan finne ut (til utvikleren) hvor en person går, hvilke butikker han går til og hvor mye penger han bruker der. Og jeg er interessert i å vite hvordan, la oss si, jeg kan selge data om publikummet mitt til disse butikkene eller legge dataene mine inn i en enorm database og få betalt for det?

Arthur Khachuyan: kunstig intelligens i markedsføring

ÅH: – Når det gjelder salg av data direkte til noen, var du og alle andre foran OFD – skattedataoperatører, som på snedig vis bygde seg mellom overføringen av sjekker og Skatteetaten og nå prøver å selge data til alle. Faktisk krasjet de faktisk hele mobilanalysemarkedet. Faktisk kan du bygge inn applikasjonen din, for eksempel Facebook-pikselen, dens DMP-system; bruk deretter denne målgruppen til å selge. For eksempel «May Target»-pikselen. Jeg vet bare ikke hva slags publikum du har, du må forstå. Men uansett kan du integrere enten i Yandex eller My Target, som er de største DMP-systemene.

Dette er en ganske interessant historie. Det eneste problemet er at du vil gi dem all trafikken, og de, som børser, vil ta på seg inntektsgenereringen av denne trafikken. De forteller deg kanskje ikke at 10 personer har brukt publikummet ditt. Derfor bygger du enten ditt eget annonsenettverk, eller så overgir du deg til store DMP-er.

Hvem vinner - artisten eller teknikeren?

Z: – Et spørsmål litt fjernt fra den tekniske delen. Det ble sagt om frykten til markedsførere for den kommende massearbeidsledigheten. Er det en slags konkurransekamp mellom kreativ markedsføring (disse gutta som kom med kyllingreklame, Volkswagen-reklame, ser det ut til) og de involverte i Big Data (som sier: nå skal vi bare samle inn all data og levere målrettet annonsering til alle)? Som en person som er direkte involvert, hva er din mening om hvem som vinner - en artist, en tekniker, eller vil det være en slags synergistisk effekt?

Arthur Khachuyan: kunstig intelligens i markedsføring

ÅH: – Hør, vel, de jobber sammen. Ingeniører kommer ikke opp med kreativitet. De som er kreative finner ikke opp et publikum. Det er en slags tverrfaglig historie her. De virkelige problemene nå er for de som sitter og trykker på knapper, for de som gjør "apejobben", og trykker på det samme hver dag - dette er menneskene som vil forsvinne.

Men de som analyserer dataene blir naturligvis værende, men noen må behandle disse dataene. Noen må komme opp med disse bildene, tegne dem. En maskin kan ikke komme opp med slik kreativitet! Dette er fullstendig galskap! Eller som for eksempel den virale reklamen til Carprice, som forresten fungerte veldig bra. Husk at det var denne på YouTube: «Selg den til Carprice», helt gal. Selvfølgelig vil ingen nevrale nettverk generere en slik historie.
Generelt er jeg tilhenger av at det ikke er folk som skal miste jobben, men de vil få litt mer fritid, og de vil kunne bruke denne fritiden på egenutdanning.

Primitiv reklame vil dø ut

Z: - I det store og hele er reklamen som vises, bannerne - i det store og hele, selv selgende tekster er ikke skrevet der: "Du trenger vinduer - ta det!", "Du trenger noe annet - ta det!", dvs. det er ingen kreativitet der i det hele tatt.

ÅH: – Slik reklame vil selvfølgelig dø ut før eller siden. Det vil dø ut ikke så mye på grunn av utviklingen av teknologi, men på grunn av utviklingen til deg og meg.

Det er bedre å blande det relevante med det irrelevante

Z: - Jeg er her! Jeg har et spørsmål om eksperimentet som du sa ikke fungerte for deg (med anbefalingssystemet). Etter din mening, er problemet det som ble signert der, hvorfor anbefales det, eller er det at alt som brukeren så virket relevant for ham? Fordi jeg leste et eksperiment for mødre, og det var ikke så mye data ennå, og det var ikke så mye data fra Internett, var det bare data fra en dagligvareforhandler som spådde graviditet (at de ville være mødre). Og da de viste et utvalg produkter for vordende mødre, ble mødre forferdet over at de fikk vite om dem før noen offisielle ting. Og det fungerte ikke. Og for å løse dette problemet blandet de bevisst relevante produkter med noe helt irrelevant.

Arthur Khachuyan: kunstig intelligens i markedsføring

ÅH: «Vi viste spesifikt folk grunnlaget for anbefalingene ble gitt for å forstå tilbakemeldingene deres. Det er faktisk her konseptet ble født om at folk ikke trenger å bli fortalt at dette er noen superrelevante produkter for ham.

Ja, forresten, det er en tilnærming til å blande dem med irrelevante. Men det er det motsatte: noen ganger kommer folk inn og samhandler med dette irrelevante produktet – tilfeldige uteliggere oppstår, modeller går i stykker og ting blir enda mer komplisert. Men dette eksisterer faktisk. Dessuten har mange selskaper bevisst, hvis de vet at noen behandler dataene deres (noen kan stjele slike utdata fra dem), noen ganger blander de det sammen slik at de senere kan bevise at du ikke tok dataene fra anbefalingssystemet deres, men fra det såkalte Yandex.Market.

Annonseblokkere og nettlesersikkerhet

Z: - Hallo. Du nevnte Ghostery og Adblock. Kan du fortelle oss hvor effektive slike sporere er generelt (kanskje basert på statistikk)? Og hadde du noen bestillinger fra selskaper: de sier, sørg for at vår annonsering ikke kan stenges av Adblock.

ÅH: – Vi tar ikke direkte kontakt med annonseplattformer – nettopp for at de ikke skal spørre om å gjøre annonseringen sin synlig for alle. Jeg bruker personlig Ghostery – jeg synes det er en veldig kul utvidelse. Nå kjemper alle nettlesere for personvern: Mozilla har gitt ut en haug med alle slags oppdateringer, Google Chrome er nå supersikkert. De blokkerer alle alt de kan. "Safari" har til og med slått av "Gyroscope" som standard.
Og denne trenden er selvfølgelig god (ikke for de som samler inn data, selv om de også kom ut av det), fordi folk først blokkerte informasjonskapsler. Alle som eide reklamenettverk husket en så fantastisk teknologi som nettlesers fingeravtrykk - dette er algoritmer som mottar 60 forskjellige parametere (skjermoppløsning, versjon, installerte fonter) og basert på dem beregner de en unik "ID". La oss gå videre til dette. Og nettlesere begynte å slite med dette. Generelt vil dette være en endeløs kamp mellom titanene.

Den siste utvikleren Mozilla er ganske sikker. Den sparer praktisk talt ingen informasjonskapsler og setter en kort levetid. Spesielt hvis du slår på "Inkognito", vil ingen finne deg i det hele tatt. Spørsmålet er at det vil være upraktisk å legge inn passord i alle tjenester.

Hvor fungerer psykotyping og fysiognomi og ikke fungerer?

Z: – Arthur, tusen takk for foredraget. Jeg liker også å følge forelesningene dine på YouTube. Du nevnte at markedsførere i økende grad tyr til å bruke psykotyping og fysiognomi. Spørsmålet mitt er: hvilke merkekategorier fungerer dette i? Min tro er at dette kun passer for FMCG. For eksempel, å velge en bil er...

ÅH: – Jeg kan laste ned hvor det fungerer. Dette fungerer i alle slags historier som "Amediateka", TV-serier, filmer og så videre. Dette fungerer bra i banker og bankprodukter, hvis det ikke er premiumsegmentet, men alle slags studentkort, avdragsordninger - den slags ting. Dette fungerer veldig bra i FMCG og alle slags iPhones, ladere, alt dette dritten. Dette fungerer bra i "mamma og pop"-produkter. Selv om jeg vet at i fiske (det er et slikt tema)... Det har vært saker med fiskere flere ganger - de kan aldri segmenteres pålitelig. Jeg vet ikke hvorfor. En slags statistisk feil.

Dette fungerer ikke bra med bilister, med smykker eller med enkelte husholdningsartikler. Faktisk fungerer det dårlig med ting som folk aldri ville skrevet om på sosiale medier – du kan sjekke det på denne måten. Konvensjonelt, med kjøp av en vaskemaskin: Slik forstår du hvem som har en vaskemaskin og hvem ikke? Det virker som om alle har det. Du kan bruke OFD-data - se hvem som kjøpte hva ved hjelp av kvitteringer, og match disse personene ved å bruke kvitteringer. Men faktisk er det ting du aldri ville snakket om, for eksempel på Instagram - det er vanskelig å jobbe med slike ting.

Maskiner gjenkjenner triks som statistisk fylling.

Z: – Jeg har et spørsmål om målretting. Er det mulig (eller eksisterer de plutselig) av en betinget tilfeldig karakter som motsier seg selv i alt: først Googler han "de beste treningssentrene", og deretter Googler han "10 måter å gjøre ingenting"? Og slik er det i alt. Kan målretting holde styr på noe som motsier seg selv?

ÅH: – Det eneste spørsmålet her er dette: hvis du har brukt Google i 2 år, fortalt alt du kan om deg selv, og nå installerer en plugin for deg selv som vil skrive lignende tilfeldige spørringer, så vil du selvfølgelig fra statistikken være i stand til å forstå – det du gjør nå er en statistisk avvik, og alt dette er et spørsmål om å sile ut. Hvis du vil, registrer en ny konto, men volumet på annonsering endres ikke. Hun blir bare rar. Selv om hun fortsatt er merkelig.

Noen annonser 🙂

Takk for at du bor hos oss. Liker du artiklene våre? Vil du se mer interessant innhold? Støtt oss ved å legge inn en bestilling eller anbefale til venner, cloud VPS for utviklere fra $4.99, en unik analog av entry-level servere, som ble oppfunnet av oss for deg: Hele sannheten om VPS (KVM) E5-2697 v3 (6 kjerner) 10GB DDR4 480GB SSD 1Gbps fra $19 eller hvordan dele en server? (tilgjengelig med RAID1 og RAID10, opptil 24 kjerner og opptil 40 GB DDR4).

Dell R730xd 2x billigere i Equinix Tier IV datasenter i Amsterdam? Bare her 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV fra $199 i Nederland! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - fra $99! Lese om Hvordan bygge infrastruktur corp. klasse med bruk av Dell R730xd E5-2650 v4-servere verdt 9000 euro for en krone?

Kilde: www.habr.com

Legg til en kommentar