Arthur Khachuyan est un spĂ©cialiste russe bien connu du traitement du Big Data, fondateur de la sociĂ©tĂ© Social Data Hub (aujourd'hui Tazeros Global). Partenaire de lâĂcole supĂ©rieure dâĂ©conomie de lâUniversitĂ© nationale de recherche. A prĂ©parĂ© et prĂ©sentĂ©, en collaboration avec l'Ăcole supĂ©rieure d'Ă©conomie de l'UniversitĂ© nationale de recherche, un projet de loi sur le Big Data au Conseil de la FĂ©dĂ©ration. Il a pris la parole Ă l'Institut Curie de Paris, Ă l'UniversitĂ© d'Ătat de Saint-PĂ©tersbourg, Ă l'UniversitĂ© fĂ©dĂ©rale du gouvernement de la FĂ©dĂ©ration de Russie, Ă Red Apple, International OpenDataDay, RIW 2016, AlfaFuturePeople.
La conférence a été enregistrée lors du festival en plein air « Geek Picnic » à Moscou en 2019.

Artur Khachuyan (ci-aprĂšs - AH) : â Si parmi un grand nombre d'industries - de la mĂ©decine, de la construction, de quelque chose, quelque chose, choisir celle oĂč la technologie du big data, de l'apprentissage automatique, de l'apprentissage profond est le plus souvent utilisĂ©e, alors il s'agit probablement de marketing. Parce que depuis environ trois ans, tout ce qui nous entoure dans une sorte de communication publicitaire est dĂ©sormais prĂ©cisĂ©ment liĂ© Ă l'analyse des donnĂ©es et prĂ©cisĂ©ment Ă ce que l'on peut appeler l'intelligence artificielle. C'est pourquoi je vais vous parler aujourd'hui d'une histoire si lointaine...
Si vous imaginez lâintelligence artificielle et Ă quoi elle ressemble, câest probablement quelque chose comme ça. L'image Ă©trange est l'un des rĂ©seaux de neurones que j'ai Ă©crit il y a un an pour trouver la dĂ©pendance de ce que fait mon chien - combien de fois doit-il devenir grand, petit, et comment cela dĂ©pend-il gĂ©nĂ©ralement de la quantitĂ© qu'il mange ou pas ? . Câest une blague sur la façon dont lâintelligence artificielle pourrait ĂȘtre imaginĂ©e.

Mais rĂ©flĂ©chissons quand mĂȘme Ă la maniĂšre dont tout cela fonctionne dans la communication publicitaire. Les algorithmes modernes de publicitĂ© et de marketing peuvent interagir avec nous de trois maniĂšres. Il est clair que la premiĂšre histoire vise Ă obtenir et Ă extraire des connaissances supplĂ©mentaires sur vous et moi, puis Ă les utiliser Ă des fins bonnes et moins bonnes ; personnaliser l'approche Ă chaque personne spĂ©cifique; Naturellement, aprĂšs cela, crĂ©ez une certaine demande afin d'effectuer l'action cible principale et de rĂ©aliser une certaine vente.
En utilisant la technologie, ils tentent de résoudre le problÚme d'une communication efficace
Si je vous dis de réfléchir à ce que Pornhub et M. Vidéo", à quoi tu penses ?
Commentaires du public (ci-aprÚs dénommé C) : - Télévision, public.
OH: â Mon concept est quâil sâagit de deux endroits oĂč les gens viennent pour un certain type de service, ou disons, un certain type de biens. Et ce public est diffĂ©rent dans le sens oĂč il ne veut rien dire au vendeur. Elle veut entrer et obtenir ce qui lâintĂ©resse sous une forme explicite ou implicite. Naturellement, personne ne vient chez M. VidĂ©o » ne veut communiquer avec aucun vendeur, ne veut pas comprendre, ne veut rĂ©pondre Ă aucune de leurs questions.
De tout cela découle donc la premiÚre histoire.
Lorsque des technologies permettant d'obtenir des connaissances supplĂ©mentaires sont apparues afin d'Ă©viter d'une maniĂšre ou d'une autre de communiquer avec une personne. Nous aimons tous quand nous appelons la banque et quâelle nous dit : « Bonjour. Alexey, vous ĂȘtes notre client VIP. Maintenant, un super manager va vous parler. Vous venez dans cette banque, et il y a vraiment un manager unique qui peut vous parler. Malheureusement ou heureusement, aucune entreprise n'a encore trouvĂ© comment embaucher un millier de managers personnels pour un millier de clients ; et comme la plupart de ces personnes sont dĂ©sormais en ligne, la tĂąche est de comprendre de quel genre de personne il s'agit et comment communiquer correctement avec elle avant qu'elle n'accĂšde Ă une ressource publicitaire. Et donc, en fait, des technologies sont apparues pour tenter de rĂ©soudre ce problĂšme.
Lâextraction de donnĂ©es est le nouveau pĂ©trole
Imaginons que vous soyez propriĂ©taire d'un stand de fleurs. Trois personnes viennent vous voir. Le premier reste trĂšs longtemps debout, hĂ©site, essaie de vous parler, prend une sorte de bouquet - vous allez l'emballer, sortez pour y faire quelque chose ; il s'enfuit de l'Ă©tal avec ce bouquet - vous avez perdu vos trois mille roubles. Pourquoi est-ce arrivĂ© ? Vous ne savez rien de cette personne : vous ne connaissez pas son historique dâarrestations au ministĂšre de lâIntĂ©rieur, vous ne savez pas quâil est kleptomane et quâil est inscrit dans un dispensaire psychiatrique. Pourquoi? Parce que vous lâavez vu pour la premiĂšre fois et que vous nâĂȘtes pas un analyste comportemental.
Quelqu'un d'autre arrive... Vitaly. Vitaly met également beaucoup de temps à comprendre, dit-il: "Eh bien, j'ai besoin de ceci et de cela." Et vous lui dites : « Des fleurs pour maman, n'est-ce pas ? Et tu lui vends un bouquet.
Le concept ici est de trouver suffisamment de données pour comprendre ce dont la personne a réellement besoin. Tout le monde a immédiatement pensé à une sorte de réseau publicitaire, etc.
Tout le monde a probablement entendu plus dâune fois lâexpression stupide selon laquelle « les donnĂ©es sont le nouveau pĂ©trole » ? SĂ»rement tout le monde a entendu. En fait, les gens ont appris Ă collecter des donnĂ©es il y a assez longtemps, mais extraire des donnĂ©es de ces donnĂ©es est la tĂąche que l'intelligence artificielle en marketing, ou une sorte d'algorithme statistique, tente dĂ©sormais de rĂ©soudre. Pourquoi? Parce que si vous parlez Ă une personne, elle peut vous donner une rĂ©ponse bonne, fausse ou colorĂ©e. La blague que je raconte Ă mes Ă©tudiants est la diffĂ©rence entre les enquĂȘtes et les statistiques. Je vais vous raconter ceci Ă titre d'anecdote :
Cela signifie que dans deux villages, ils ont dĂ©cidĂ© de mener une Ă©tude sur la durĂ©e moyenne de la virilitĂ©. Cela signifie que dans le premier village, Villaribo, la longueur moyenne est de 15 centimĂštres, dans le village de Villabaggio - 25. Savez-vous pourquoi ? Car des mesures ont Ă©tĂ© rĂ©alisĂ©es dans le premier village, et une enquĂȘte a Ă©tĂ© rĂ©alisĂ©e dans le second.
L'industrie du porno est le fleuron des systĂšmes de recommandation
Câest pourquoi lâapproche moderne consiste Ă analyser toutes les personnes sans exception, mĂȘme si elles sont un peu moins de 100 %, mais ce sont ces personnes que vous nâavez pas besoin de demander, vous nâavez pas besoin de les regarder. Il suffit d'analyser ce qu'on appelle dĂ©sormais une empreinte numĂ©rique pour comprendre ce dont cette personne a besoin, comment lui parler correctement, comment crĂ©er correctement la demande autour d'elle. Dâun cĂŽtĂ©, il sâagit dâune machine stupide (mais vous et moi le savons trĂšs bien) ; nous ne voulons pas communiquer avec les gens de M. VidĂ©o », et plus encore, lorsque nous accĂ©dons Ă des ressources comme Pornhub, nous voulons obtenir exactement ce dont nous avons besoin.
Pourquoi est-ce que je parle toujours de Pornhub ? Parce que l'industrie pour adultes est la premiĂšre Ă venir Ă l'analyse de telles technologies, Ă la mise en Ćuvre de telles technologies, Ă l'analyse des donnĂ©es. Si vous prenez les trois bibliothĂšques les plus populaires dans ce domaine (par exemple, TensorFlow ou Pandas pour Python, pour le traitement des fichiers CSV, etc.), si vous l'ouvrez sur Github, avec un petit Google de tous ces noms vous trouverez un quelques personnes qui ont travaillĂ© ou travaillent actuellement dans la sociĂ©tĂ© Pornhub et qui ont Ă©tĂ© les premiĂšres Ă y mettre en Ćuvre des systĂšmes de recommandation. De maniĂšre gĂ©nĂ©rale, cette histoire est trĂšs avancĂ©e, et montre Ă quel point ce public, Ă quel point cette entreprise a progressĂ©.

Trois niveaux d'identification
Il existe un vaste ensemble de donnĂ©es sur une personne qui peuvent ĂȘtre identifiĂ©es. Je divise habituellement formellement cela en trois niveaux, allant de plus en plus profondĂ©ment. Bien entendu, lâentreprise dispose de ses propres donnĂ©es.
Si, par exemple, nous parlons de crĂ©er un systĂšme de recommandation, le premier niveau concerne les donnĂ©es qui se trouvent dans le magasin lui-mĂȘme (historique des achats, toutes sortes de transactions, comment une personne a interagi avec l'interface).
Il y a ensuite un niveau (relativement le plus grand) : c'est ce qu'on appelle les sources ouvertes. Ne pensez pas que je vous encourage à gratter les réseaux sociaux, mais en fait, ce qui est disponible dans les sources ouvertes ouvre un vaste ensemble de données que vous pouvez, par exemple, en apprendre davantage sur une personne.
Et le troisiĂšme Ă©lĂ©ment majeur est lâenvironnement de cette personne elle-mĂȘme. Oui, il existe une opinion selon laquelle si une personne n'est pas sur les rĂ©seaux sociaux, il n'y a aucune donnĂ©e Ă son sujet (vous savez probablement dĂ©jĂ que ce n'est pas vrai), mais le plus important est que les donnĂ©es qui se trouvent sur le profil d'une personne (ou dans certaines applications) ne reprĂ©sente que 40 % des connaissances pouvant ĂȘtre obtenues Ă ce sujet. Le reste des informations est obtenu de son environnement. Lâexpression « dis-moi qui est ton ami et je te dirai qui tu es » prend un nouveau sens au XNUMXe siĂšcle car une Ă©norme quantitĂ© de donnĂ©es peut ĂȘtre obtenue autour de cette personne.
Si nous parlons plus prÚs des communications publicitaires, alors recevoir des communications publicitaires non pas de la publicité, mais d'un ami, d'une connaissance ou d'une personne vérifiée d'une maniÚre ou d'une autre est une fonctionnalité trÚs intéressante que de nombreux spécialistes du marketing utilisent. Lorsqu'une application vous propose soudainement un code promo gratuit, vous publiez un message à ce sujet et attirez ainsi un nouveau public. En fait, ce code promotionnel pour le conditionnel « Yandex.Taxi » n'a pas été choisi au hasard, mais pour cela, une énorme quantité de données a été analysée sur votre potentiel à attirer un nouveau public et à interagir d'une maniÚre ou d'une autre avec lui.

Ils analysent mĂȘme le comportement des personnages de sĂ©ries tĂ©lĂ©visĂ©es
Je vais vous montrer trois photos et vous me direz quelle est la différence entre elles.
Celui-ci:

Ce:

Et celui-lĂ :

Quelle est la diffĂ©rence entre eux ? Tout est simple ici. Comme en mĂ©canique quantique, cette crĂ©ativitĂ© est ici formĂ©e par lâobservateur. Autrement dit, la diffĂ©rence dans une mĂȘme campagne publicitaire, menĂ©e par la mĂȘme marque au mĂȘme moment, rĂ©side uniquement dans la personne qui a regardĂ© cette crĂ©ation. Personnellement, quand je vais Ă Amediateka, ils montrent encore Khal Drogo. Je ne sais pas ce que pense Amediateka de mes prĂ©fĂ©rences, mais pour une raison quelconque, cela arrive.
Ce que lâon appelle aujourdâhui les communications personnalisĂ©es est lâhistoire la plus populaire pour attirer un public et interagir correctement avec lui. Si dans un premier temps nous identifions des personnes en utilisant nos propres donnĂ©es de marque, des donnĂ©es open source et, par exemple, des donnĂ©es de l'environnement de cette personne, nous pouvons, aprĂšs l'avoir analysĂ©e, comprendre qui elle est, comment lui parler correctement et, surtout , quelle langue il parle, parlez-lui.
Ici, la technologie est allée si loin que les personnages des séries télévisées que les gens regardent sont désormais analysés. Autrement dit, vous aimez les séries télévisées - elles [j'aime] sont regardées, elles regardent avec qui vous avez interagi là -bas, afin de comprendre avec quel genre de personne vous conviendrait d'interagir. Cela semble complÚtement absurde, mais juste pour vous amuser, essayez-le sur l'une des ressources - différentes personnes voient différentes créations (afin d'interagir correctement avec elles).
Pas un seul média moderne ni aucune ressource vidéo ne vous montre des nouvelles. Allez dans les médias - un grand nombre d'algorithmes sont chargés qui vous identifient, comprennent toutes vos activités précédentes, font appel au modÚle mathématique et vous montrent ensuite quelque chose. Dans ce cas-ci, il y a une histoire tellement étrange.
Comment sont déterminés les besoins ? Psychométrie. Physionomie
Il existe de nombreuses approches (rĂ©elles) pour dĂ©terminer les besoins rĂ©els dâune personne et comment communiquer correctement avec elle. Il existe de nombreuses approches, tout est rĂ©solu diffĂ©remment, il est impossible de dire laquelle est bonne et laquelle est mauvaise. Les principaux semblent tout savoir.

PsychomĂ©trie. AprĂšs l'histoire de Cambridge Analytics, cela a pris une sorte de tournure choquante, Ă mon avis, car une entreprise politique sur deux vient maintenant et dit : « Oh, pouvez-vous me faire aimer Trump ? Je veux aussi gagner, et ainsi de suite. En fait, cela nâa bien sĂ»r aucun sens pour nos rĂ©alitĂ©s, par exemple les Ă©lections politiques. Mais pour dĂ©terminer les psychotypes, trois modĂšles sont utilisĂ©s :
- le premier est basĂ© sur le contenu que vous consommez â les mots que vous Ă©crivez, certaines informations que vous aimez, les vidĂ©os, etc. ;
- la seconde est liée à la façon dont vous interagissez avec l'interface Web, à la façon dont vous tapez, aux boutons sur lesquels vous appuyez - en effet, il existe des entreprises entiÚres qui, sur la base de l'écriture manuscrite de leur clavier, peuvent déterminer de maniÚre assez fiable ce qu'on appelle aujourd'hui les psychotypes.
- Je ne suis pas vraiment psychologue, je ne comprends pas vraiment comment ça marche, mais du point de vue de la communication publicitaire, les audiences divisĂ©es en ces segments fonctionnent trĂšs bien, car il faut montrer Ă quelqu'un un Ă©cran rouge avec un Ă©cran bleu femme, il faut montrer Ă quelqu'un un Ă©cran sombre, un fond bleu avec une sorte d'abstraction, et ça marche trĂšs bien. Ă certains niveaux bas, Ă tel point quâune personne nây pense mĂȘme pas. Quel est actuellement le principal problĂšme du marchĂ© publicitaire ? Tout le monde est un agent de renseignement, tout le monde se cache, tout le monde a installĂ© un million de milliers d'autorisations de navigateur, afin de ne pas ĂȘtre identifiĂ© de quelque maniĂšre que ce soit - vous avez probablement "Adblocks", "Gostrey" et toutes sortes d'applications qui bloquent le suivi. Pour cette raison, il est trĂšs difficile de comprendre quoi que ce soit sur une personne. Et la technologie a Ă©voluĂ© : vous devez non seulement savoir que cette personne est revenue sur votre site pour la 125Ăšme fois, mais qu'elle est aussi telle ou telle personne Ă©trange.
La physionomie est une science trĂšs controversĂ©e. Ce nâest mĂȘme pas considĂ©rĂ© comme une science. Il s'agit d'un groupe de personnes qui programmaient des dĂ©tecteurs de mensonges pour certains ministĂšres de l'IntĂ©rieur et qui se consacrent dĂ©sormais Ă ce qu'on appelle la personnification de la crĂ©ativitĂ©. L'approche ici est trĂšs simple : plusieurs de vos photographies publiques sont prises Ă partir de certains rĂ©seaux sociaux, et une gĂ©omĂ©trie tridimensionnelle est construite Ă partir d'elles. Et si vous ĂȘtes avocat, vous direz dĂ©sormais qu'il s'agit d'une personne et de donnĂ©es personnelles ; mais je vais vous dire que ce sont 300 XNUMX points situĂ©s dans l'espace, et ce n'est pas une personne, ni des donnĂ©es personnelles. C'est ce que tout le monde dit habituellement lorsque Roskomnadzor vient le voir.
Mais sĂ©rieusement, votre visage sĂ©parĂ©ment, si votre prĂ©nom et votre nom n'y sont pas signĂ©s, ne sont pas vos donnĂ©es personnelles. Le fait est que les gars marquent diverses caractĂ©ristiques du visage qui influencent la façon dont une personne prend des dĂ©cisions et comment interagir correctement avec elle. Dans certains domaines, cela fonctionne mal, dans certains segments publicitaires ; dans quels segments cela fonctionne-t-il trĂšs bien. En fin de compte, il s'avĂšre que lorsque vous accĂ©dez Ă une ressource, vous ne voyez pas seulement une banniĂšre qui s'affiche Ă tout le monde, mais, par exemple... maintenant, il est normal de crĂ©er 16 ou 20 options pour diffĂ©rents publics - et cela fonctionne trĂšs cool. Oui, câest encore plus triste du point de vue du consommateur, car il commence Ă se laisser de plus en plus manipuler. NĂ©anmoins, dâun point de vue commercial, cela fonctionne trĂšs bien.
La boĂźte noire du machine learning
Cela pose le problĂšme suivant avec de telles technologies : aprĂšs tout, pour la plupart des dĂ©veloppeurs, ce quâon appelle le deep learning est dĂ©sormais une « boĂźte noire ». Si vous avez dĂ©jĂ Ă©tĂ© plongĂ© dans cette histoire et parlĂ© aux dĂ©veloppeurs, ils disent toujours : « Oh, Ă©coutez, eh bien, nous avons codĂ© quelque chose de tellement incomprĂ©hensible lĂ -bas, et nous ne savons pas comment cela fonctionne. Peut-ĂȘtre que quelqu'un a vĂ©cu cela.
Câest en rĂ©alitĂ© loin dâĂȘtre vrai. Ce que lâon appelle aujourdâhui le machine learning est loin dâĂȘtre une « boĂźte noire ». Il existe un grand nombre d'approches pour dĂ©crire les donnĂ©es d'entrĂ©e et de sortie, et en fin de compte, l'entreprise peut parfaitement comprendre, sur la base de quels signes la machine a dĂ©cidĂ© de vous montrer telle ou telle vidĂ©o pornographique. Le problĂšme est quâaucune des entreprises ne le divulgue jamais, car : premiĂšrement, il sâagit dâun secret commercial ; deuxiĂšmement, il y aura une Ă©norme quantitĂ© de donnĂ©es dont vous ne connaissiez mĂȘme pas lâexistence.
Par exemple, auparavant, dans une discussion sur l'Ă©thique, nous avons discutĂ© de la maniĂšre dont les rĂ©seaux sociaux analysent les messages personnels afin de marquer les gens dans certaines sortes d'histoires publicitaires. Si vous Ă©crivez quelque chose Ă quelqu'un, sur cette base, vous recevez une balise spĂ©cifique pour, en fait, une sorte de communication publicitaire. Et vous ne le prouverez jamais, et cela ne sert probablement Ă rien de le prouver. Cependant, si des modĂšles similaires Ă©taient rĂ©vĂ©lĂ©s, ils existeraient. Il sâavĂšre que le marchĂ© de la construction de tels systĂšmes de recommandation fait semblant de ne pas savoir pourquoi cela sâest produit.
Les gens ne veulent pas savoir ce que les autres savent d'eux
Et la deuxiĂšme histoire est que le client ne veut jamais savoir pourquoi il a reçu telle publicitĂ©, tel produit particulier. Je vais vous raconter cette histoire. Ma premiĂšre expĂ©rience dans la mise en Ćuvre commerciale de systĂšmes de recommandation basĂ©s sur des algorithmes similaires prĂ©cisĂ©ment Ă des fins de recherche a eu lieu en 2015 dans un trĂšs grand rĂ©seau de sex-shops (oui, ce n'est pas non plus une histoire particuliĂšrement dĂ©sagrĂ©able).

Les clients se sont vu proposer ce qui suit : ils entrent, se connectent avec leur rĂ©seau social et aprĂšs environ 5 secondes, ils reçoivent une boutique entiĂšrement personnalisĂ©e pour eux, c'est-Ă -dire que tous les produits ont changĂ© - ils entrent dans une certaine catĂ©gorie, et ainsi de suite. . Savez-vous Ă quel point le taux de conversion de ce magasin a augmentĂ© ? En aucun cas ! Les gens sont entrĂ©s et ont immĂ©diatement pris la fuite. Ils sont entrĂ©s et ont rĂ©alisĂ© quâon leur proposait exactement ce Ă quoi ils pensaientâŠ
Le problĂšme avec ce test Ă©tait que sous chaque produit il Ă©tait Ă©crit pourquoi on vous avait proposĂ© celui-lĂ en particulier (« parce que vous ĂȘtes membre du groupe cachĂ© « Une femme puissante cherche un homme qui est un paillasson »). Câest pourquoi les systĂšmes de recommandation modernes nâaffichent jamais les donnĂ©es sur la base desquelles la « prĂ©diction » a Ă©tĂ© rĂ©alisĂ©e.
Les mĂ©dias sont une histoire trĂšs populaire car ils utilisent tous des systĂšmes de recommandation similaires. Auparavant, les algorithmes Ă©taient trĂšs simples : regardez la catĂ©gorie « Politique » - et ils vous montrent les actualitĂ©s de la catĂ©gorie « Politique ». Maintenant, tout est si compliquĂ© qu'ils analysent les endroits oĂč vous avez arrĂȘtĂ© la souris, sur quels mots vous vous ĂȘtes concentrĂ©, ce que vous avez copiĂ©, comment vous avez gĂ©nĂ©ralement interagi avec cette page. Puis il analyse le vocabulaire des messages eux-mĂȘmes : oui, vous ne lisez pas seulement des nouvelles sur Poutine, mais dâune certaine maniĂšre, avec une certaine coloration Ă©motionnelle. Et quand une personne reçoit des nouvelles, elle ne pense mĂȘme pas Ă la façon dont elle est arrivĂ©e ici. NĂ©anmoins, il interagit ensuite avec ce contenu.
Tout cela, bien sûr, vise à préserver le pauvre et malheureux petit homme qui devient déjà fou de l'énorme quantité d'informations qui l'entourent. Ici, il faut dire qu'il serait bien d'utiliser de tels systÚmes pour personnaliser la création autour de vous et collecter certaines informations, mais, malheureusement, de tels services n'existent pas encore.
L'intelligence artificielle capte le client dans les airs et crée la demande
Et ici se pose une question philosophique trĂšs intĂ©ressante, passer de la crĂ©ation d'un systĂšme de recommandation Ă la crĂ©ation de demande. On y pense rarement, mais lorsque vous essayez de demander Ă ce quâon appelle Instagram : « Pourquoi collectez-vous des donnĂ©es ? Pourquoi ne pas me montrer des publicitĂ©s absolument alĂ©atoires ? » - Instagram vous dira : « Mon ami, tout cela est fait pour vous montrer exactement ce qui vous intĂ©resse. » Par exemple, nous voulons vous connaĂźtre si prĂ©cisĂ©ment afin de pouvoir vous montrer exactement ce que vous recherchez.

Mais la technologie a depuis longtemps franchi ce terrible seuil, et des technologies similaires ne prĂ©disent plus ce dont vous avez besoin. Ils (attention !) crĂ©ent de la demande. Câest probablement la chose la plus effrayante qui tourne autour de lâintelligence artificielle dans de telles communications. Ce qui est effrayant, c'est qu'il a Ă©tĂ© utilisĂ© presque partout au cours des 3 Ă 5 derniĂšres annĂ©es - des rĂ©sultats de recherche Google aux rĂ©sultats de recherche Yandex, en passant par certains systĂšmes... D'accord, je ne dirai rien de mal Ă propos de Yandex ; et bien.
Ă quoi ça sert? Il y a longtemps que ces communications publicitaires se sont Ă©loignĂ©es de la stratĂ©gie consistant Ă Ă©crire « Je veux acheter un siĂšge enfant » et Ă voir cent milliards de publications. Ils sont passĂ©s au suivant : dĂšs que la femme postait une photo avec un ventre Ă peine visible, son mari commençait immĂ©diatement Ă ĂȘtre suivi de messages : « Mec, l'accouchement approche. Achetez un siĂšge enfant."
Ici, on pourrait raisonnablement se demander pourquoi, avec des avancées technologiques aussi gigantesques, voit-on encore des publicités aussi merdiques sur les réseaux sociaux ? Le problÚme est que sur ce marché, tout est encore décidé par l'argent, donc à un moment donné, un annonceur comme Coca-Cola peut venir et dire : "Voici 20 millions pour vous - montrez mes banniÚres merdiques sur tout Internet." Et ils le feront vraiment.
Mais si vous crĂ©ez une sorte de compte propre et testez avec quelle prĂ©cision ces algorithmes vous devinent : ils essaient d'abord de vous deviner, puis ils commencent Ă vous faire quelque chose Ă l'avance. Et le cerveau humain fonctionne de telle maniĂšre que, lorsqu'il reçoit des informations qui lui sont fiables, il ne traite mĂȘme pas le moment pour lequel il a reçu ces informations. La premiĂšre rĂšgle pour dĂ©terminer que vous ĂȘtes dans un rĂȘve est de comprendre comment vous ĂȘtes arrivĂ© ici. Une personne ne se souvient jamais du moment oĂč elle s'est retrouvĂ©e dans une certaine piĂšce. C'est la mĂȘme chose ici.
Google pourrait commencer à façonner votre vision du monde
De telles Ă©tudes ont Ă©tĂ© rĂ©alisĂ©es par plusieurs sociĂ©tĂ©s Ă©trangĂšres engagĂ©es dans l'i-tracking. Ils ont installĂ© des dispositifs sur des ordinateurs spĂ©ciaux qui enregistrent oĂč regardent les yeux du sujet testĂ©. J'ai emmenĂ© cinq Ă sept mille volontaires qui ont simplement fait dĂ©filer le flux, interagi avec les rĂ©seaux sociaux, avec la publicitĂ©, et ils ont enregistrĂ© des informations sur les parties des banniĂšres et des crĂ©ations sur lesquelles ces personnes ont arrĂȘtĂ© leurs yeux.
Et il s'avĂšre que lorsque les gens reçoivent une crĂ©ation aussi hyper-personnalisĂ©e, ils n'y pensent mĂȘme pas - ils passent immĂ©diatement Ă autre chose, commencent Ă interagir avec. D'un point de vue commercial, c'est bien, mais de notre point de vue, en tant qu'utilisateurs, ce n'est pas trĂšs cool, car - de quoi ont-ils peur ? â QuâĂ un moment donnĂ©, le « Google » conditionnel puisse commencer (ou, bien sĂ»r, ne pas commencer) Ă former sa propre vision du monde. Demain, par exemple, il pourra commencer Ă annoncer aux gens que la Terre est plate.
Je plaisante, mais ils ont Ă©tĂ© arrĂȘtĂ©s tellement de fois que lors des Ă©lections, ils commencent Ă donner certaines informations Ă certaines personnes. Nous sommes tous habituĂ©s au fait que le moteur de recherche obtient tout honnĂȘtement. Mais, comme je le dis toujours, si vous voulez vraiment savoir comment fonctionne le monde, Ă©crivez votre propre moteur de recherche, sans filtres, sans prĂȘter attention aux droits d'auteur, sans classer certains de vos amis dans les rĂ©sultats de recherche. L'affichage des donnĂ©es rĂ©elles sur Internet est gĂ©nĂ©ralement diffĂ©rent de celui affichĂ© par Google, Yandex, Bing, etc. Certains documents sont cachĂ©s parce que des amis, des collĂšgues, des ennemis ou quelqu'un d'autre (ou un ancien amant avec qui vous avez couchĂ©) n'ont pas d'importance.
Comment Trump a gagné
Lors des derniĂšres Ă©lections aux Ătats-Unis, une Ă©tude trĂšs simple a Ă©tĂ© menĂ©e. Ils ont reçu les mĂȘmes requĂȘtes Ă diffĂ©rents endroits, Ă partir de diffĂ©rentes adresses IP, de diffĂ©rentes villes, diffĂ©rentes personnes ont recherchĂ© la mĂȘme chose sur Google. Traditionnellement, la demande Ă©tait du style : qui gagnera les Ă©lections ? Et Ă©tonnamment, les rĂ©sultats ont Ă©tĂ© construits de telle maniĂšre que dans les Ătats oĂč le plus grand nombre de personnes ont essayĂ© de voter pour le mauvais candidat, ils ont reçu de bonnes nouvelles concernant le candidat promu par Google. Lequel? Eh bien, il est clair lequel â celui qui est devenu prĂ©sident. Câest une histoire absolument impossible Ă prouver, et toutes ces Ă©tudes ne sont quâun doigt dans lâeau. Google peut dire : « Les gars, tout cela est fait pour que nous vous montrions le contenu le plus pertinent. »
DĂ©sormais, sachez que ce quâon appelle la pertinence maximale nâest absolument pas le cas. L'entreprise qualifie de pertinent quelque chose qui doit vous ĂȘtre vendu pour une bonne ou une mauvaise raison.
Ceux qui nâont pas dâargent actuellement se prĂ©parent dĂ©jĂ Ă de futurs achats
Il y a ici un autre point intĂ©ressant dont je vais vous parler. Les jeunes constituent dĂ©sormais un grand nombre de publics actifs sur les rĂ©seaux sociaux et dans les applications. Appelons ça ainsi - les jeunes insolvables : les enfants de 8-9 ans qui jouent Ă des jeux dĂ©biles, ce sont des 12-13-14 ans qui viennent de s'inscrire sur les rĂ©seaux sociaux. Pourquoi les grandes entreprises dĂ©penseraient-elles dâĂ©normes budgets et ressources pour crĂ©er des applications destinĂ©es Ă un public non payant et jamais monĂ©tisĂ© ? Au moment oĂč ce public deviendra solvable, il y aura une quantitĂ© suffisante de donnĂ©es Ă son sujet pour trĂšs bien prĂ©dire son comportement.

Demandez maintenant Ă nâimporte quel cibologue : quel est le public le plus difficile ? Ils diront : trĂšs rentable. Parce que vendre, par exemple, un appartement d'une valeur de 150 millions de roubles via les rĂ©seaux sociaux est presque impossible. Il y a des cas isolĂ©s oĂč vous faites une sorte de publicitĂ© pour 10 XNUMX personnes, on achĂšte cet appartement - le client est un succĂšs... Mais un sur dix mille, d'un point de vue statistique, c'est de la merde totale. Alors, pourquoi est-il difficile dâidentifier un public Ă revenus Ă©levĂ©s ? Parce que les personnes qui font aujourd'hui partie d'un public trĂšs lucratif sont nĂ©es Ă une Ă©poque oĂč Internet Ă©tait encore trĂšs petit, quand personne ne connaissait encore Artemy Lebedev et qu'il n'y a aucune information Ă leur sujet. Il est impossible de prĂ©dire leur comportement, il est impossible de comprendre qui sont leurs leaders dâopinion et de quelles sources de contenu ils reçoivent.
Ainsi, lorsque vous deviendrez tous milliardaires dans 25 ans, et que les entreprises qui vont vous vendre quelque chose disposeront dâune Ă©norme quantitĂ© de donnĂ©es. C'est pourquoi nous disposons dĂ©sormais d'un merveilleux RGPD en Europe qui empĂȘche la collecte de donnĂ©es auprĂšs de mineurs.
Naturellement, cela ne fonctionne pas du tout dans la pratique, puisque tous les enfants jouent encore sur les comptes de leur mÚre et de leur pÚre - c'est ainsi que les informations sont collectées. La prochaine fois que vous donnerez un comprimé à votre enfant, pensez-y.
Absolument pas un avenir effrayant et dystopique, oĂč tout le monde mourra dans une guerre contre les machines â une histoire absolument rĂ©elle maintenant. Il existe un grand nombre dâentreprises qui crĂ©ent des algorithmes pour profiler les personnes en fonction de la façon dont elles jouent Ă des jeux. Une industrie trĂšs intĂ©ressante. Sur la base de tout cela, les gens sont ensuite segmentĂ©s afin de communiquer d'une maniĂšre ou d'une autre avec eux.

La prĂ©diction du comportement de ces personnes sera disponible dans 10 Ă 15 ans - prĂ©cisĂ©ment au moment oĂč elles deviendront un public solvable. Le plus important est que ces personnes ont dĂ©jĂ donnĂ© au prĂ©alable lâautorisation de traiter leurs donnĂ©es personnelles, de les transmettre Ă des tiers, et tout cela nâest que bonheur, etc.
Qui va perdre son emploi ?
Et ma derniÚre histoire, c'est que tout le monde se demande toujours ce qui se passera dans 50 ans : nous allons tous mourir, il y aura du chÎmage pour les marketeurs... Il y a des marketeurs ici qui s'inquiÚtent du chÎmage, non ? En général, il n'y a pas lieu de s'inquiéter, car toute personne hautement qualifiée ne perdra pas son emploi.

Quels que soient les algorithmes créés, peu importe Ă quel point la machine se rapproche de ce que nous avons ici (il montre sa tĂȘte), si elle se dĂ©veloppe assez rapidement, ces personnes ne resteront jamais inactives, car quelqu'un devra crĂ©er ces choses crĂ©atives. faire. Oui, il existe toutes sortes de « gans » qui dessinent des images qui ressemblent Ă des personnes et crĂ©ent de la musique, mais il est toujours peu probable que les gens de cette rĂ©gion perdent un jour leur emploi.

J'ai tout avec l'histoire, vous pouvez donc poser des questions si vous en avez plus. Merci.

ModĂ©rateur â Les amis, nous passons maintenant au bloc « Questions et rĂ©ponses ». Vous levez la main - je m'approche de vous.

Question du public (XNUMX) : â Question sur la « boĂźte noire ». Ils disaient qu'il Ă©tait possible de comprendre prĂ©cisĂ©ment pourquoi tel ou tel rĂ©sultat Ă©tait obtenu pour tel ou tel utilisateur. S'agit-il d'une sorte d'algorithme, ou faut-il l'analyser Ă chaque fois pour chaque modĂšle ad hoc (ndlr : « spĂ©cialement pour cela » - une unitĂ© phrasĂ©ologique latine) ? Ou existe-t-il des rĂ©seaux de neurones prĂȘts Ă l'emploi qui, en gros, peuvent avoir un sens commercial ?
OH: â Ici, vous devez comprendre ce qui suit : il existe un grand nombre de tĂąches dans lâapprentissage automatique. Par exemple, il existe une tĂąche : la rĂ©gression. Pour la rĂ©gression, aucun rĂ©seau de neurones nâest nĂ©cessaire. Tout est simple : vous disposez de plusieurs indicateurs, vous devez calculer les suivants. Il existe des tĂąches pour lesquelles il est nĂ©cessaire de recourir Ă l'apprentissage profond. En effet, dans lâapprentissage profond, il est difficile de comprendre de maniĂšre fiable quels poids ont Ă©tĂ© attribuĂ©s Ă quels neurones, mais lĂ©galement, tout ce dont vous avez besoin est de comprendre quelles donnĂ©es se trouvaient Ă lâentrĂ©e et comment elles se sont dĂ©roulĂ©es Ă la sortie. Câest lĂ©galement suffisant pour breveter une telle dĂ©cision et pour comprendre sur quelle base lâhistoire a Ă©tĂ© construite.
Ce nâest pas comme si vous Ă©tiez allĂ© sur le site et quâon vous avait montrĂ© une sorte de banniĂšre parce que vous aviez pris une photo avec des cheveux roux sur Instagram il y a deux mois. Si le dĂ©veloppeur n'inclut pas la collecte de ces donnĂ©es et le marquage de la couleur des cheveux dans ce modĂšle, cela ne viendra pas de nulle part.
Comment vendre les résultats des systÚmes de machine learning ?
Z : â Câest juste une question de quoi : exactement comment expliquer, comment vendre Ă quelquâun qui ne comprend pas lâapprentissage automatique. J'ai envie de dire : mon modĂšle mĂšne clairement de la couleur des cheveux Ă ... eh bien, la couleur des cheveux change... Est-ce possible ou pas ?

OH: - Peut-ĂȘtre oui. Mais d'un point de vue commercial, le seul schĂ©ma fonctionnera : vous lancez une campagne publicitaire, nous remplaçons l'audience par celle gĂ©nĂ©rĂ©e par la machine - et vous voyez juste le rĂ©sultat. C'est malheureusement le seul moyen de convaincre de maniĂšre fiable le client qu'une telle histoire fonctionne, car il existe de nombreuses solutions sur le marchĂ© qui ont Ă©tĂ© mises en Ćuvre une fois et qui n'ont pas fonctionnĂ©.
à propos de la création d'une personnalité virtuelle
Z : - Bonjour. Merci pour la conférence. La question est : quelle chance a une personne qui, pour une raison quelconque, ne veut pas suivre l'exemple de l'apprentissage automatique, de se créer une personnalité virtuelle radicalement différente de sa propre personnalité, par interaction avec l'interface ou pour certains autre raison?

OH: â Il existe de nombreux plugins diffĂ©rents qui traitent spĂ©cifiquement du comportement alĂ©atoire. Il y a une chose intĂ©ressante - Ghostery, qui, Ă mon avis, vous cache presque complĂštement d'un tas de trackers diffĂ©rents qui ne peuvent ensuite pas enregistrer ces informations. Mais en fait, il suffit dĂ©sormais d'avoir un profil fermĂ© sur les rĂ©seaux sociaux pour que personne, aucun mĂ©chant grattoir, ne puisse y collecter quoi que ce soit. Il est probablement prĂ©fĂ©rable d'installer une sorte d'extension ou d'Ă©crire quelque chose vous-mĂȘme.
Vous voyez, le concept ici est que lĂ©galement, par exemple, les donnĂ©es personnelles font rĂ©fĂ©rence aux donnĂ©es grĂące auxquelles vous pouvez ĂȘtre identifiĂ©, et la loi donne comme exemple votre adresse de rĂ©sidence, votre Ăąge, etc. Il existe aujourd'hui une quantitĂ© incalculable de donnĂ©es permettant de vous identifier : la mĂȘme Ă©criture manuscrite sur le clavier, la mĂȘme pression, la signature numĂ©rique du navigateur... TĂŽt ou tard, une personne commet une erreur. Il peut ĂȘtre quelque part dans un « cafĂ© » en utilisant « Thor », mais Ă la fin, Ă un bon moment, soit le VPN oubliera de s'allumer, soit autre chose, et Ă ce moment-lĂ il pourra ĂȘtre identifiĂ©. Le moyen le plus simple est donc de crĂ©er un compte privĂ© et dâinstaller une extension.
Le marchĂ© Ă©volue vers le point oĂč il suffit dâappuyer sur un seul bouton pour obtenir des rĂ©sultats.
Z : - Merci pour l'histoire. Comme toujours, toujours trÚs intéressant (je vous suis). La question est : quels progrÚs y a-t-il en termes de création de systÚmes positifs pour les utilisateurs, de systÚmes de recommandation ? Vous avez dit qu'à une époque vous travailliez sur un systÚme de recommandation pour trouver un partenaire sexuel, un ami dans la vie (ou une musique qu'une personne pourrait potentiellement aimer)... Comme tout cela est prometteur et comment voyez-vous son évolution à partir de du point de vue de la création de systÚmes dont les gens ont besoin ?
OH: â En gĂ©nĂ©ral, le marchĂ© Ă©volue au point oĂč les gens doivent appuyer sur un bouton et obtenir immĂ©diatement ce dont ils ont besoin. Quant Ă mon expĂ©rience dans la crĂ©ation d'applications de rencontres (d'ailleurs nous la relancerons Ă la fin de l'annĂ©e), outre le fait que 65% Ă©taient des hommes mariĂ©s, le problĂšme de recommandation le plus difficile Ă©tait qu'une personne se voyait proposer plusieurs modĂšles. au dĂ©but de l'application - « AmitiĂ© », « Sexe », « AmitiĂ© sexuelle » et « Affaires ». Les gens ne choisissaient pas ce dont ils avaient besoin. Les hommes sont venus et ont choisi « Amour », mais en rĂ©alitĂ© ils ont jetĂ© de la nuditĂ© sur tout le monde, et ainsi de suite.
Le problĂšme Ă©tait d'identifier une personne qui ne correspondait pas Ă l'un de ces modĂšles, et de la prendre en douceur et de la dĂ©placer dans l'autre sens. En raison du petit nombre de donnĂ©es, il est trĂšs difficile de dĂ©terminer s'il s'agit d'une erreur dans l'algorithme de prĂ©vision ou si une personne n'appartient pas Ă sa catĂ©gorie. Câest la mĂȘme chose avec la musique : il existe dĂ©sormais trĂšs peu dâalgorithmes vraiment valables capables de bien « diffuser » la musique. Peut-ĂȘtre « Yandex.Music ». Certaines personnes pensent que l'algorithme Yandex.Music est mauvais. Par exemple, je l'aime bien. Personnellement, par exemple, je nâaime pas lâalgorithme de musique YouTube, etc.
Il y a bien sĂ»r quelques subtilitĂ©s - tout est liĂ© aux licences... Mais en rĂ©alitĂ©, la demande pour de tels systĂšmes est assez Ă©levĂ©e. Ă une certaine Ă©poque, on connaissait la sociĂ©tĂ© Retail Rocket, qui Ă©tait impliquĂ©e dans la mise en Ćuvre de systĂšmes de recommandation, mais maintenant, elle ne s'en sort pas trĂšs bien - apparemment parce qu'elle n'a pas dĂ©veloppĂ© ses algorithmes depuis longtemps. Tout va dans ce sens - au point que nous entrons et, sans rien appuyer, obtenons ce dont nous avons besoin (et devenons complĂštement stupides, car notre capacitĂ© de choisir a complĂštement disparu).
Marketing d'influence
Z : - Bonjour. Je m'appelle Constantin. Je voudrais soulever une question sur le marketing dâinfluence. Connaissez-vous des systĂšmes qui permettent Ă une entreprise de sĂ©lectionner un blogueur appropriĂ© pour l'entreprise sur la base de certaines donnĂ©es statistiques, etc. ? Et pour quelles raisons cela est-il fait ?

OH: â Oui, je pars de loin et je dis tout de suite que le problĂšme avec toutes ces technologies, c'est que toute cette intelligence artificielle dans le marketing est dĂ©sormais comme un funambule : Ă gauche il y a de grandes entreprises qui ont beaucoup d'argent, et Ă de toute façon tout sera efficace pour leur travail car leurs campagnes publicitaires visent simplement les vues ; dâun autre cĂŽtĂ©, il y a beaucoup de petites entreprises pour lesquelles cela ne fonctionnera pas, car elles disposent de beaucoup de donnĂ©es. JusquâĂ prĂ©sent, lâapplicabilitĂ© de ces histoires se situe quelque part entre les deux.
Quand il y a dĂ©jĂ de bons budgets et que la tĂąche est de traiter ces budgets correctement (et, en principe, il y a dĂ©jĂ pas mal de donnĂ©es)⊠Je connais quelques services, quelque chose comme Getblogger, qui semblent avoir des algorithmes. Pour ĂȘtre honnĂȘte, je n'ai pas Ă©tudiĂ© ces algorithmes. Je peux vous dire quelle approche nous utilisons pour trouver des leaders d'opinion lorsque nous devons offrir un cadeau Ă certaines mamans.
Nous utilisons une mĂ©trique appelĂ©e Content Distribution Time. Cela fonctionne comme ceci : vous prenez une personne dont vous analysez l'audience, et vous devez systĂ©matiquement (par exemple, une fois toutes les 5 minutes) collecter des informations sur chaque publication, qui l'a aimĂ©, qui l'a commentĂ©e, etc. De cette façon, vous pouvez comprendre Ă quel moment chaque personne de votre audience a interagi avec votre contenu. RĂ©pĂ©tez cette opĂ©ration pour chaque reprĂ©sentant de son audience, et ainsi, en utilisant la mĂ©trique du temps moyen de diffusion d'un contenu, celui-ci peut par exemple ĂȘtre colorĂ© dans un grand graphe de rĂ©seau de ces personnes et utiliser cette mĂ©trique pour construire des clusters.
Cela fonctionne trĂšs bien si l'on veut, par exemple, trouver 15 mĂšres qui maintiennent leur opinion publique sur some woman.ru. Mais il sâagit dâune implĂ©mentation technique assez complexe (mĂȘme si, en thĂ©orie, elle peut ĂȘtre rĂ©alisĂ©e en Python). En fin de compte, le problĂšme du marketing dâinfluence dans les grandes agences de publicitĂ©, câest quâelles ont besoin de gros blogueurs sympas et chers qui ne travaillent pas pour de la merde. DĂ©sormais, une marque automobile souhaite vendre un produit par l'intermĂ©diaire d'un leader d'opinion. Elle doit utiliser un blogueur automobile en dernier recours, car son public soit a dĂ©jĂ achetĂ© une voiture, soit sait exactement quel type de voiture il veut, il suffit de s'asseoir et de regarde des voitures cool. Ici, il est important de ne pas manquer l'analyse de l'audience de la personne elle-mĂȘme.
Bots marketing
Z : â Dites-moi, dans quelle mesure les robots des rĂ©seaux sociaux affectent-ils la collecte dâinformations et leur qualitĂ© ?

OH: â Câest une chose tellement intĂ©ressante avec les robots. Les robots bon marchĂ© sont assez faciles Ă identifier : soit ils ont le mĂȘme contenu, soit ils sont amis les uns avec les autres, soit ils font partie du mĂȘme rĂ©seau. Il existe Ă©galement des approches pour gĂ©rer les robots complexes. Ou posez-vous le problĂšme de savoir comment connecter une personne Ă son faux ?
Z : â Quelle sera la qualitĂ© des informations produites avec toutes ces ordures ?
OH: â Ici, cela fonctionne ainsi : en raison du fait qu'il existe une Ă©norme quantitĂ© de donnĂ©es (par exemple, pour une sorte d'Ă©tude de marketing), toutes ces racailles peuvent simplement ĂȘtre jetĂ©es. Autrement dit, il vaut mieux expulser un peu plus de personnes rĂ©elles que de capturer des robots, car il est inutile pour eux de montrer de la publicitĂ©. Mais si vous collectez des mesures, par exemple les interactions avec des banniĂšres ou des systĂšmes de recommandation, ces comptes peuvent ĂȘtre supprimĂ©s.
Aujourdâhui, sur les rĂ©seaux sociaux, on compte environ six pour cent de personnages virtuels ou simplement de pages abandonnĂ©es ou introvertis, que les algorithmes « associent » Ă des robots. Quant Ă lier une personne Ă son faux, ici aussi, tout est liĂ© au fait que la personne fera tĂŽt ou tard une erreur, et le fait est que le modĂšle de comportement est le mĂȘme - Ă la fois son compte rĂ©el et son faux. TĂŽt ou tard, ils regarderont le mĂȘme contenu ou autre chose.
Ici, tout ne se rĂ©sume pas au pourcentage dâerreur, mais au temps nĂ©cessaire pour identifier une personne de maniĂšre fiable. Pour quelquâun qui vit avec son Instagram, ce temps dâidentification fiable se rĂ©sume Ă cinq minutes. Pour certains â dâici six Ă huit mois.
à qui et comment vendre des données ?
Z : - Bonjour. Je souhaite savoir comment les donnĂ©es sont vendues entre entreprises ? Par exemple, j'ai une application dans laquelle vous pouvez savoir (au dĂ©veloppeur) oĂč va une personne, dans quels magasins elle va et combien d'argent elle y dĂ©pense. Et je suis curieux de savoir comment, disons, je peux vendre des donnĂ©es sur mon audience Ă ces magasins ou mettre mes donnĂ©es dans une Ă©norme base de donnĂ©es et ĂȘtre payĂ© pour cela ?

OH: â Quant Ă la vente directe de donnĂ©es Ă quelquâun, vous et tous Ă©tiez en avance sur lâOFD â les opĂ©rateurs de donnĂ©es fiscales, qui se sont astucieusement construits entre le transfert des chĂšques et le Service des ImpĂŽts et tentent dĂ©sormais de vendre les donnĂ©es Ă tout le monde. En fait, ils ont fait sâeffondrer lâensemble du marchĂ© de lâanalyse mobile. En effet, vous pouvez embarquer votre application, par exemple, le pixel Facebook, son systĂšme DMP ; puis utilisez cette audience pour vendre. Par exemple, le pixel « May Target ». Je ne sais tout simplement pas quel genre de public vous avez, vous devez comprendre. Mais dans tous les cas, vous pouvez intĂ©grer soit Yandex, soit My Target, qui sont les plus grands systĂšmes DMP.
C'est une histoire assez intéressante. Le seul problÚme est que vous leur donnerez tout le trafic et qu'ils, en tant qu'échanges, prendront en charge la monétisation de ce trafic. Ils peuvent ou non vous dire que 10 personnes ont utilisé votre audience. Par conséquent, soit vous construisez votre propre réseau publicitaire, soit vous vous abandonnez aux grandes DMP.
Qui va gagner : l'artiste ou le technicien ?
Z : â Une question un peu Ă©loignĂ©e de la partie technique. Il a Ă©tĂ© question des craintes des spĂ©cialistes du marketing face au chĂŽmage de masse Ă venir. Existe-t-il une sorte de lutte concurrentielle entre le marketing crĂ©atif (ces gars qui ont inventĂ© la publicitĂ© pour les poulets, la publicitĂ© pour Volkswagen, semble-t-il) et ceux impliquĂ©s dans le Big Data (qui disent : maintenant nous allons simplement collecter toutes les donnĂ©es et diffuser de la publicitĂ© ciblĂ©e Ă tout le monde ) ? En tant que personne directement impliquĂ©e, quelle est votre opinion sur qui va gagner : un artiste, un technicien, ou y aura-t-il une sorte d'effet synergique ?

OH: â Ăcoute, eh bien, ils travaillent ensemble. Les ingĂ©nieurs ne font pas preuve de crĂ©ativitĂ©. Ceux qui sont crĂ©atifs nâinventent pas de public. Il y a ici une sorte dâhistoire multidisciplinaire. Les vrais problĂšmes maintenant, ce sont ceux qui s'assoient et appuient sur des boutons, ceux qui font le « travail de singe », en appuyant sur la mĂȘme chose tous les jours â ce sont ces gens qui vont disparaĂźtre.
Mais ceux qui analysent les donnĂ©es resteront naturellement, mais quelqu'un doit traiter ces donnĂ©es. Quelqu'un devra imaginer ces images, les dessiner. Une machine ne peut pas faire preuve dâune telle crĂ©ativitĂ© ! C'est une folie totale ! Ou comme par exemple la publicitĂ© virale de Carprice, qui dâailleurs a trĂšs bien fonctionnĂ©. Souvenez-vous, il y avait celui-ci sur YouTube : « Vendez-le chez Carprice », absolument dingue. Bien entendu, aucun rĂ©seau de neurones ne gĂ©nĂ©rera une telle histoire.
En général, je suis partisan du fait que ce ne sont pas les gens qui perdront leur emploi, mais qu'ils auront un peu plus de temps libre, et ils pourront consacrer ce temps libre à s'auto-éduquer.
La publicité primitive va disparaßtre
Z : - Dans l'ensemble, la publicitĂ© diffusĂ©e, les banniĂšres - dans l'ensemble, mĂȘme les textes de vente n'y sont pas Ă©crits : "Vous avez besoin de fenĂȘtres - prenez-les !", "Vous avez besoin d'autre chose - prenez-le !", c'est-Ă -dire il nây a aucune crĂ©ativitĂ© lĂ -bas.
OH: â Bien entendu, cette publicitĂ© disparaĂźtra tĂŽt ou tard. Elle disparaĂźtra non pas tant Ă cause du dĂ©veloppement de la technologie, mais Ă cause du dĂ©veloppement de vous et de moi.
Il vaut mieux mélanger le pertinent avec le non pertinent
Z : - Je suis là ! J'ai une question sur l'expérience qui, selon vous, n'a pas fonctionné pour vous (avec le systÚme de recommandation). à votre avis, le problÚme est-il ce qui y a été signé, pourquoi est-il recommandé, ou est-ce que tout ce que l'utilisateur a vu lui a semblé pertinent ? Parce que j'ai lu une expérience pour les mÚres, et il n'y avait pas encore beaucoup de données, et il n'y avait pas beaucoup de données sur Internet, il y avait juste des données d'un détaillant en alimentation qui prédisaient une grossesse (qu'elles seraient mÚres). Et lorsqu'ils ont montré une sélection de produits destinés aux femmes enceintes, les mÚres ont été horrifiées d'avoir découvert leur existence avant toute information officielle. Et ça n'a pas marché. Et pour résoudre ce problÚme, ils ont délibérément mélangé des produits pertinents avec quelque chose de complÚtement hors de propos.

OH: « Nous avons spĂ©cifiquement montrĂ© aux gens sur quelle base les recommandations Ă©taient faites afin de comprendre leurs retours. En fait, câest de lĂ quâest nĂ© le concept selon lequel les gens nâont pas besoin quâon leur dise que ce sont des produits extrĂȘmement pertinents pour eux.
Oui, en passant, il existe une approche consistant Ă les mĂ©langer avec des Ă©lĂ©ments non pertinents. Mais il y a le contraire : parfois, des gens entrent et interagissent avec ce produit non pertinent â ââdes valeurs aberrantes alĂ©atoires se produisent, les modĂšles se brisent et les choses deviennent encore plus compliquĂ©es. Mais cela existe rĂ©ellement. De plus, de nombreuses entreprises, si elles savent que quelqu'un traite leurs donnĂ©es (quelqu'un pourrait leur voler ces rĂ©sultats), les mĂ©langent parfois afin de pouvoir prouver plus tard que vous n'avez pas extrait les donnĂ©es de son systĂšme de recommandation, mais de le soi-disant Yandex.Market.
Bloqueurs de publicités et sécurité du navigateur
Z : - Bonjour. Vous avez mentionnĂ© Ghostery et Adblock. Pouvez-vous nous dire quelle est lâefficacitĂ© de ces trackers en gĂ©nĂ©ral (peut-ĂȘtre sur la base de statistiques) ? Et avez-vous reçu des ordres d'entreprises : elles disent, assurez-vous que notre publicitĂ© ne puisse pas ĂȘtre fermĂ©e par Adblock.
OH: â Nous ne contactons pas directement les plateformes publicitaires â justement pour quâelles ne demandent pas Ă rendre leur publicitĂ© visible Ă tous. Personnellement, jâutilise Ghostery â je pense que câest une extension trĂšs intĂ©ressante. DĂ©sormais, tous les navigateurs se battent pour la confidentialitĂ© : Mozilla a publiĂ© de nombreuses mises Ă jour de toutes sortes, Google Chrome est dĂ©sormais ultra-sĂ©curisĂ©. Ils bloquent tous tout ce qu'ils peuvent. « Safari » a mĂȘme dĂ©sactivĂ© « Gyroscope » par dĂ©faut.
Et cette tendance, bien sĂ»r, est bonne (pas pour ceux qui collectent des donnĂ©es, mĂȘme s'ils en sont Ă©galement sortis), car les gens ont d'abord bloquĂ© les cookies. Tous ceux qui possĂ©daient des rĂ©seaux publicitaires se souvenaient d'une technologie aussi merveilleuse que les empreintes digitales du navigateur - ce sont des algorithmes qui reçoivent 60 paramĂštres diffĂ©rents (rĂ©solution d'Ă©cran, version, polices installĂ©es) et sur cette base, ils calculent un « ID » unique. Passons Ă cela. Et les navigateurs ont commencĂ© Ă avoir du mal avec cela. En gĂ©nĂ©ral, ce sera une bataille de titans sans fin.
Le dernier développeur Mozilla est assez sécurisé. Il n'enregistre pratiquement aucun cookie et définit une courte durée de vie. Surtout si vous activez « Incognito », personne ne vous trouvera du tout. Le problÚme est qu'il ne sera pas pratique de saisir des mots de passe dans tous les services.
OĂč le psychotypage et la physionomie fonctionnent-ils et ne fonctionnent-ils pas ?
Z : â Arthur, merci beaucoup pour la confĂ©rence. J'aime Ă©galement suivre vos confĂ©rences sur YouTube. Vous avez mentionnĂ© que les spĂ©cialistes du marketing ont de plus en plus recours au psychotypage et Ă la physionomie. Ma question est la suivante : dans quelles catĂ©gories de marques cela fonctionne-t-il ? Je pense que cela ne convient que pour les produits de grande consommation. Par exemple, choisir une voiture, c'est...
OH: â Je peux tĂ©lĂ©charger lĂ oĂč cela fonctionne exactement. Cela fonctionne dans toutes sortes d'histoires comme « Amediateka », les sĂ©ries tĂ©lĂ©visĂ©es, les films, etc. Cela fonctionne bien dans les banques et les produits bancaires, mĂȘme s'il ne s'agit pas du segment premium, mais de toutes sortes de cartes d'Ă©tudiant, de plans de versement, ce genre de choses. Cela fonctionne vraiment trĂšs bien dans les produits de grande consommation et toutes sortes d'iPhones, de chargeurs, toutes ces conneries. Cela fonctionne bien dans les produits « maman et pop ». Bien que je sache que dans la pĂȘche (il existe un tel sujet)... Il y a eu plusieurs cas avec des pĂȘcheurs - ils ne peuvent jamais ĂȘtre segmentĂ©s de maniĂšre fiable. Je ne sais pas pourquoi. Une sorte d'erreur statistique.
Cela ne fonctionne pas bien avec les automobilistes, avec les bijoux ou avec certains articles mĂ©nagers. En fait, cela ne fonctionne pas bien avec des choses sur lesquelles les gens n'Ă©criraient jamais sur les rĂ©seaux sociaux - vous pouvez le vĂ©rifier de cette façon. Classiquement, Ă lâachat dâune machine Ă laver : voici comment comprendre qui a une machine Ă laver et qui nâen a pas ? Il semble que tout le monde l'ait. Vous pouvez utiliser les donnĂ©es OFD - voir qui a achetĂ© quoi Ă l'aide de reçus et faire correspondre ces personnes Ă l'aide de reçus. Mais en fait, il y a des choses dont on ne parlerait jamais, par exemple sur Instagram - c'est difficile de travailler avec de telles choses.
Les machines reconnaissent les astuces comme du bourrage statistique.
Z : â J'ai une question sur le ciblage. Est-il possible (ou existent-ils soudainement) qu'un personnage alĂ©atoire conditionnel se contredise en tout : d'abord il cherche sur Google « les meilleures salles de sport », puis il cherche sur Google « 10 façons de ne rien faire » ? Et il en est ainsi en tout. Le ciblage peut-il garder une trace de quelque chose qui se contredit ?
OH: â La seule question ici est la suivante : si vous utilisez Google depuis 2 ans, que vous lui avez dit tout ce que vous pouvez sur vous-mĂȘme et que vous installez maintenant un plugin pour vous-mĂȘme qui Ă©crira des requĂȘtes alĂ©atoires similaires, alors, bien sĂ»r, Ă partir des statistiques, vous le ferez. ĂȘtre capable de comprendre â ce que vous faites actuellement est une valeur statistique aberrante, et tout cela est une question de tri. Si vous le souhaitez, crĂ©ez un nouveau compte, mais le volume de publicitĂ© ne changera pas. Elle va juste devenir bizarre. MĂȘme si elle reste Ă©trange.

Quelques publicitĂ©s đ
Merci de rester avec nous. Vous aimez nos articles ? Vous voulez voir du contenu plus intĂ©ressant ? Soutenez-nous en passant une commande ou en recommandant Ă vos amis, , un analogue unique des serveurs d'entrĂ©e de gamme, que nous avons inventĂ© pour vous : (disponible avec RAID1 et RAID10, jusqu'Ă 24 cĆurs et jusqu'Ă 40 Go de DDR4).
Dell R730xd 2 fois moins cher dans le centre de données Equinix Tier IV à Amsterdam ? Ici seulement aux Pays-Bas! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - à partir de 99$ ! En savoir plus
Source: habr.com
