Arthur Khachuyan:营销中的人工智能

Arthur Khachuyan 是俄罗斯著名的大数据处理专家,Social Data Hub 公司(现为 Tazeros Global)的创始人。 国立研究大学高等经济学院合作伙伴。 与国立研究大学高等经济学院共同起草并提出联邦委员会大数据法案。他在巴黎居里研究所、圣彼得堡国立大学、俄罗斯联邦政府下属联邦大学发表演讲,红苹果、国际开放数据日、RIW 2016、AlfaFuturePeople。

该讲座是在2019年莫斯科露天音乐节“极客野餐”上录制的。

Arthur Khachuyan:营销中的人工智能

亚瑟·卡楚扬(Arthur Khachuyan,以下简称“AH”): – 如果从众多的行业——从医药、从建筑、从某事、某事中选择一个最常使用大数据、机器学习、深度学习技术的行业,那么这可能就是营销。 因为在过去三年左右的时间里,我们周围的某种广告传播中的一切现在都与数据分析和所谓的人工智能紧密相关。 所以,今天我就给大家讲讲这个遥远的历史……

如果你想象一下人工智能及其外观,它可能就是这样的。 这张奇怪的图是我一年前写的一个神经网络,用来寻找我的狗所做的事情的依赖性——她需要变大、变小多少次,以及它通常如何取决于她吃了多少或不? 这是一个关于如何想象人工智能的笑话。

Arthur Khachuyan:营销中的人工智能

但是,我们仍然要考虑一下这一切在广告传播中是如何运作的。 广告和营销领域的现代算法可以通过三种方式与我们互动。 很明显,第一个故事的目的是获取和提取关于你和我的额外知识,然后将其用于一些好的或不太好的目的; 对每个特定的人采取个性化的方法; 当然,在此之后,创造一定的需求,以执行主要目标行动并进行一定的销售。

他们试图利用技术来解决有效沟通的问题

如果我告诉你想想 Pornhub 和 M. 视频”,你在想什么?

观众评价(以下简称C): - 电视、观众。

哦: – 我的概念是,这是人们为了某种类型的服务而来的两个地方,或者我们称之为某种类型的商品。 而这个受众的不同之处在于,他们不想告诉卖家任何事情。 她想进来并以某种明确或隐含的形式获得她感兴趣的东西。 自然就没有人来找M了。 视频”不想与任何卖家沟通,不想理解,不想回答他们的任何问题。

因此,第一个故事就由此而来。

当获得额外知识的技术出现时,以便以某种方式避免与人交流。 我们都喜欢当我们打电话给银行,银行告诉我们:“你好。 Alexey,你是我们的 VIP 客户。 现在有超级经理来跟你说话。” 你来到这家银行,确实有一位独特的经理可以和你交谈。 不幸的是,还是幸运的是,目前还没有一家公司能够弄清楚如何为一千名客户聘请一千名私人经理。 由于这些人现在大多数都在线,因此任务是在他接触某些广告资源之前了解他是什么样的人以及如何与他正确沟通。 因此,事实上,已经出现了试图解决这个问题的技术。

数据提取是新石油

假设您是一个花摊的老板。 三个人来看你。 第一个站了很长时间,犹豫了一下,试图和你说话,拿了某种花束——你去把它包起来,出去做点什么; 他带着这束花从摊位跑了——你已经损失了三千卢布。 为什么会发生这样的事? 你对这个人一无所知:你不知道他在内政部被捕的历史,你不知道他是一个盗窃狂并且在精神病药房登记。 为什么? 因为你是第一次看到它,而且你不是行为分析师。

还有人来了……维塔利。 维塔利也花了很长时间才弄清楚,他说,“好吧,我需要这个和那个。” 然后你告诉他:“给妈妈送花,对吧?” 然后你卖给他一束花。

这里的概念是找到足够的数据来了解人们的实际需求。 大家立刻就想到了某种广告网络之类的……

大家可能不止一次听过“数据就是新石油”这句愚蠢的话吧? 想必大家都听说过。 事实上,人们很久以前就学会了收集数据,但从这些数据中提取数据是营销中的人工智能,或者某种统计算法现在正在努力解决的任务。 为什么? 因为如果你和一个人交谈,他可以给你一个正确、错误或某种带有色彩的答案。 我给我的学生讲的笑话是调查与统计有何不同。我将这作为一个轶事告诉你们:

这意味着他们决定在两个村庄进行一项关于男性平均寿命的研究。 这意味着在第一个村庄 Villaribo,平均长度为 15 厘米,在 Villabaggio 村为 25 厘米。你知道为什么吗? 因为测量是在第一个村进行的,调查是在第二个村进行的。

色情行业是推荐系统的旗舰

这就是为什么现代的方法是无一例外地分析所有人,即使他们略低于100%,但这些人是你不需要问的人,你不需要看他们。 分析现在所谓的数字足迹就足以了解这个人需要什么,如何正确地与他交谈,如何正确地在他周围创造需求。 一方面,这是一台无意识的机器(但你我都清楚这一点); 我们不想和M的人交流。 视频”,更重要的是,当我们访问 Pornhub 等资源时,我们希望得到我们真正需要的东西。

为什么我总是谈论 Pornhub? 因为成人产业是最先进行此类技术的分析、此类技术的实施、数据分析的。 如果你采用该领域最流行的三个库(例如,用于处理 CSV 文件的 TensorFlow 或 Pandas for Python,等等),如果你在 Github 上打开它,用简短的 Google 搜索所有这些名称,你会发现有几个人曾经或现在在 Pornhub 公司工作,并且是第一个在那里实施推荐系统的人。 总的来说,这个故事是非常先进的,并且展示了这个观众有多少,这家公司向前迈进了多少。

Arthur Khachuyan:营销中的人工智能

三个级别的识别

一个人周围有大量可以识别的数据。 我通常将其正式分为三个层次,越来越深入。 当然,公司有自己的数据。

比如说,如果我们正在谈论构建一个推荐系统,那么第一层就是位于商店本身的数据(购买历史记录、各种交易、人如何与界面交互)。

接下来还有一个级别(相对最大)——这就是所谓的开源。 不要以为我鼓励你抓取社交网络,但事实上,开源中提供的内容打开了大量数据,你可以通过这些数据了解一个人。

而第三大的部分就是这个人本身的环境。 是的,有一种观点认为,如果一个人不在社交网络上,那么那里就没有关于他的数据(您可能已经知道这不是真的),但最重要的是一个人的个人资料上的数据(或在某些应用中)仅占可获得的知识的 40%。 其余的信息是从他的环境中获得的。 “告诉我你的朋友是谁,我就会告诉你你是谁”这句话在 XNUMX 世纪有了新的含义,因为可以获取有关该人的大量数据。

如果我们更接近广告传播,那么接收广告传播不是来自广告,而是来自一些朋友、熟人或以某种方式经过验证的人,这是许多营销人员使用的一个非常酷的功能。 当某个应用程序突然向您提供免费促销代码时,您会发布有关它的帖子,从而吸引新的受众。 事实上,这个有条件“Yandex.Taxi”的促销代码并不是随机选择的,但为此,我们分析了大量数据,了解您吸引新受众并以某种方式与他们互动的潜力。

Arthur Khachuyan:营销中的人工智能

他们甚至分析电视剧人物的行为

我给你看三张图片,你告诉我它们之间有什么区别。

这一个:

Arthur Khachuyan:营销中的人工智能

这个:

Arthur Khachuyan:营销中的人工智能

和这个:

Arthur Khachuyan:营销中的人工智能

他们之间有什么区别? 这里一切都很简单。 与量子力学一样,在这种情况下,这种创造力是由观察者形成的。 也就是说,同一品牌在同一时间进行的同一广告活动的差异仅在于谁观看了该创意。 就我个人而言,当我去阿梅迪亚特卡时,他们仍然展示卓戈卡奥。 我不知道 Amediateka 对我的偏好有何看法,但由于某种原因,这种情况发生了。

现在所谓的个性化沟通是最流行的吸引受众并与之适当互动的故事。 如果在第一阶段我们使用我们自己的品牌数据、开源数据以及例如来自这个人的环境的数据来识别人,那么在分析他之后,我们可以了解他是谁,如何正确地与他交谈,最重要的是,他用什么语言跟他说话。

技术已经发展到可以对人们观看的电视剧中的角色进行分析的程度。 就是你喜欢电视剧,他们看,他们看你在里面和谁互动,从而了解你适合和什么样的人互动。 这听起来完全是无稽之谈,但只是为了好玩,在其中一种资源上尝试一下 - 不同的人会看到不同的创意(以便正确地与其交互)。

没有任何一个现代媒体或任何视频资源只是向您展示一些新闻。 去媒体——加载大量算法来识别您的身份,了解您之前的所有活动,诉诸数学模型,然后向您展示一些东西。 在这种情况下,就有了这样一个离奇的故事。

需求如何确定? 心理测量学。 相貌

有很多(真实的)方法可以确定一个人的实际需求以及如何与他们正确沟通。 方法有很多种,每件事的解决方法都不同,不可能说哪个好哪个坏。 主要的人似乎什么都知道。

Arthur Khachuyan:营销中的人工智能

心理测量学。 在剑桥分析公司的报道之后,在我看来,事情发生了某种令人震惊的转折,因为现在每隔一个政治公司就会过来说:“哦,你能让我变得像特朗普吗? 我也想赢,等等。” 事实上,这对于我们的现实,例如政治选举来说,当然是无稽之谈。 但为了确定心理类型,使用了三种模型:

  • 第一个是基于你消费的内容——你写的文字、你喜欢的一些信息、视频等;
  • 第二个与你如何与网络界面交互、你如何打字、你按下哪些按钮有关——事实上,有一些公司可以根据他们的键盘笔迹,非常可靠地确定现在所谓的心理类型。
  • 我不是一个心理学家,我不太明白它是如何运作的,但从广告传播的角度来看,分为这些部分的受众效果很好,因为需要向某人展示带有蓝色的红色屏幕女人,需要向某人展示一个带有某种抽象的黑色屏幕-蓝色背景,而且它的效果非常酷。 在某些低水平上——以至于人们甚至不会考虑它。 现在广告市场的主要问题是什么? 每个人都是情报人员,每个人都在隐藏,每个人都安装了数百万个浏览器权限,以免以任何方式被识别 - 你可能有“Adblocks”、“Gostrey”和各种阻止跟踪的应用程序。 正因为如此,要了解一个人的任何事情都是非常困难的。 技术已经进步——你不仅需要知道这个人已经第 125 次回到你的网站,而且他也是一个如此如此奇怪的人。

面相学是一门非常有争议的科学。 它甚至不被认为是科学。 这是一群曾经为某些内务部编写测谎仪程序的人,现在从事所谓的创造力拟人化。 这里的方法非常简单:你的几张公开照片取自一些社交网络,并根据它们构建三维几何。 如果你是一名律师,你现在会说这是一个人和个人数据; 但我告诉你,这是位于太空的三十万个点,这不是一个人,也不是个人数据。 这是每个人在 Roskomnadzor 来找他们时通常都会说的话。

但说实话,如果你的名字和姓氏没有在那里签名,那么你的脸就不是你的个人数据。 关键是,这些人标出了各种面部特征,这些特征会影响一个人如何做出决定以及如何与他正确互动。 在某些领域,在某些广告领域,这种方法效果不佳; 它在哪些细分领域表现得很好。 最后,事实证明,当您访问某些资源时,您看到的不仅仅是一个向所有人展示的横幅,而且,例如……现在为不同的受众提供 16 或 20 个选项是很正常的 - 而且它有效很酷。 是的,从消费者的角度来看,这更令人难过,因为人们开始越来越多地被操纵。 但无论如何,从商业角度来看,它的效果非常好。

机器学习的黑匣子

这就带来了此类技术的以下问题:毕竟,对于大多数开发人员来说,现在所谓的深度学习是一个“黑匣子”。 如果你曾经沉浸在这个故事中并与开发人员交谈过,他们总是会说:“哦,听着,好吧,我们在那里编写了一些难以理解的代码,而且我们不知道它是如何工作的。” 也许有人遇到过这种情况。

这实际上远非事实。 现在所谓的机器学习远非“黑匣子”。 描述输入和输出数据的方法有很多种,最终公司可以根据什么迹象彻底了解机器决定向你展示这个或其他色情视频。 问题是,没有一家公司披露过这一点,因为:首先,这是商业秘密; 其次,会有大量你不知道的数据。

例如,在此之前,在关于道德的讨论中,我们讨论了社交网络如何分析个人消息,以便在某种广告故事中标记人物。 如果您给某人写了一些东西,基于此您会收到一个特定的标签,实际上是某种广告通信。 你永远无法证明这一点,而且证明它可能没有任何意义。 然而,如果类似的模式被发现,它们就会存在。 事实证明,构建此类推荐系统的市场假装不知道为什么会发生这种情况。

人们不想知道人们对他们的了解

第二个故事是,客户永远不想知道为什么他收到这个特定的广告、这个特定的产品。 我会告诉你这个故事。 我第一次出于研究目的而商业实施基于类似算法的推荐系统是在 2015 年,在一个非常大的性用品商店网络中(是的,这也不是一个特别令人不快的故事)。

Arthur Khachuyan:营销中的人工智能

为客户提供以下服务:他们进来,使用社交网络登录,大约 5 秒后,他们会收到一个完全个性化的商店,也就是说,所有产品都发生了变化 - 它们属于某个类别,等等。 你知道这家店的转化率提高了多少吗? 无论如何都不是! 人们进来后立即逃离。 他们进来后意识到,他们所得到的正是他们所想的......

这个测试的问题在于,在每件产品下都写着为什么向您提供该特定产品(“因为您是隐藏群体的成员”强大的女人正在寻找一个受气包的男人”)。 因此,现代推荐系统从不显示做出“预测”所依据的数据。

一个非常流行的故事是媒体,因为它们都使用类似的推荐系统。 以前,算法非常简单:查看“政治”类别 - 它们会向您显示“政治”类别中的新闻。 现在一切都变得如此复杂,他们会分析你停止鼠标的地方、你集中注意力的单词、你复制的内容、你通常如何与这个页面交互。 然后他分析了消息本身的词汇:是的,你不仅仅是在阅读有关普京的新闻,而是以某种方式,带有某种情感色彩。 而当一个人收到一些消息的时候,他根本不会去想自己是怎么来到这里的。 尽管如此,他随后仍与该内容进行交互。

当然,这一切都是为了让这个可怜的、不幸的小男人不被周围的大量信息弄得发疯。 这里必须要说的是,如果能使用这样的系统来个性化你周围的创意并收集一些信息,那就太好了,但不幸的是,目前还没有这样的服务。

人工智能捕捉空中客户并创造需求

这里出现了一个非常有趣的哲学问题,从创建推荐系统到创造需求。 很少有人思考这个问题,但当你试图问所谓的 Instagram 时,“你为什么要收集数据? 为什么不向我展示绝对随机的广告呢?” - Instagram 会告诉你:“朋友,这一切都是为了向你准确展示你感兴趣的内容。” 就像,我们想准确地了解您,以便我们可以准确地向您展示您正在寻找的东西。

Arthur Khachuyan:营销中的人工智能

但技术早已跨越了这个可怕的门槛,类似的技术不再预测你需要什么。 他们(注意!)创造需求。 这可能是此类通信中围绕人工智能最可怕的事情。 可怕的是,在过去的 3-5 年里,它几乎无处不在——从 Google 搜索结果到 Yandex 搜索结果,再到某些系统……好吧,我不会说 Yandex 的任何坏话; 好的。

重点是什么? 此类广告传播已经很久没有摆脱那种写下“我想买一个儿童座椅”然后看到十亿份出版物的策略了。 他们接着说:当这位女士发布了一张几乎看不见肚子的照片时,她的丈夫立即开始收到消息:“男人,马上就要生产了。 买个儿童座椅吧。”

在这里,你可能会合理地问,为什么随着技术的巨大进步,我们仍然在社交网络上看到如此糟糕的广告? 问题是,在这个市场上,一切仍然是由金钱决定的,所以某个好时机,一些像可口可乐这样的广告商可能会过来说:“这里有 20 万给你——把我的烂横幅展示给整个互联网。” 他们真的会这么做。

但是,如果你做了某种干净的帐户并测试这些算法猜测你的准确程度:他们首先尝试猜测你,然后他们开始提前对你做一些事情。 人脑的工作方式是,当接收到对其来说可靠的信息时,它甚至不会处理接收到该信息的原因。 确定你是否在梦中的首要规则是了解你是如何来到这里的。 一个人永远不会记得他进入某个房间的那一刻。 这里也是一样。

谷歌可能开始塑造你的世界观

此类研究是由几家从事i-tracking的外国公司进行的。 他们在特殊的计算机上安装了设备,记录测试对象眼睛的注视位置。 我招募了五到七千名志愿者,他们只是简单地滚动信息流,与社交网络和广告进行互动,然后他们记录了这些人将目光停留在横幅和创意的哪些部分的信息。

事实证明,当人们收到如此超个性化的创意时,他们甚至不会考虑它 - 他们立即继续前进,开始与之互动。 从商业角度来看,这很好,但从我们作为用户的角度来看,这并不是很酷,因为——他们害怕什么? – 在一个好的时刻,有条件的“谷歌”可能开始(或者,当然,它可能不会开始)形成自己的世界观。 例如,明天他就可以开始向人们展示地球是平的的消息。

开玩笑,但他们被抓了很多次,以至于在选举期间他们开始向某些人提供某些信息。 我们都习惯了搜索引擎诚实地获取一切的事实。 但是,正如我常说的,如果您真的想知道世界是如何运作的,请编写自己的搜索引擎,无需过滤器,无需关注版权,无需在搜索结果中对您的一些朋友进行排名。 互联网上真实数据的显示通常与Google、Yandex、Bing等显示的不同。 有些材料被隐藏是因为朋友、同事、敌人或其他人(或与你睡过的前情人)——这并不重要。

特朗普如何获胜

美国上次选举时,进行了一项非常简单的研究。 他们在不同的地方、不同的 IP 地址、不同的城市接受了相同的请求,不同的人在 Google 上搜索了相同的内容。 按照惯例,请求的风格是:谁将赢得选举? 令人惊讶的是,结果的构建方式是,在那些试图投票给错误候选人的人数最多的州,他们收到了有关谷歌宣传的候选人的一些好消息。 哪一个? 嗯,很清楚是哪一位——成为总统的那一位。 这是一个绝对无法证实的故事,所有这些研究都是徒劳的。 谷歌可以说:“伙计们,这一切都是为了我们向你们展示最相关的内容。”

从现在开始,你应该知道,所谓的最大相关性,绝​​对不是这样的。 该公司称相关的东西出于某种好或坏的原因需要卖给你。

现在没钱的人已经为以后的购买做好了准备

这里还有一个有趣的点我要告诉你。 现在社交网络和应用程序中的大量活跃受众是年轻人。 我们称之为——无力偿债的青少年:8-9岁的孩子,他们玩低能游戏,这些孩子12岁、13岁、14岁,刚刚在社交网络上注册。 为什么大公司会花费大量的预算和资源来为非付费受众创建从未货币化的应用程序? 当这些受众变得有偿付能力时,就会有足够的数据来很好地预测其行为。

Arthur Khachuyan:营销中的人工智能

现在问问目标学家,最难对付的受众是什么? 他们会说:利润很高。 因为,例如,通过社交网络出售一套价值 150 亿卢布的公寓几乎是不可能的。 有一些孤立的情况,当你为一万人做某种广告时,其中一个人买了这套公寓——客户是成功的……但从统计的角度来看,万分之一是完全垃圾。 那么,为什么难以识别高收入受众呢? 因为现在成为高利润受众的人们是在互联网还很小的时候出生的,当时还没有人认识阿尔乔米·列别杰夫,也没有关于他们的信息。 无法预测他们的行为模式,无法了解他们的意见领袖是谁以及他们从哪些来源接收内容。

因此,当你们在 25 年后都成为亿万富翁时,那些要向你们出售东西的公司将拥有大量数据。 这就是为什么我们现在在欧洲制定了一项出色的 GDPR,以防止收集未成年人的数据。

当然,这在实践中根本行不通,因为所有的孩子仍然在他们父母的账户上玩——这就是信息收集的方式。 下次您给孩子使用平板电脑时,请考虑一下这一点。

绝对不是某个可怕的反乌托邦未来,每个人都会在与机器的战争中死去——现在这绝对是真实的故事。 有大量公司正在根据人们玩游戏的方式创建算法,对他们进行心理分析。 一个非常有趣的行业。 基于这一切,人们被细分,以便以某种方式与他们沟通。

Arthur Khachuyan:营销中的人工智能

对这些人的行为的预测将在 10-15 年内实现——正是在他们成为有偿付能力的受众的那一刻。 最重要的是,这些人已经提前获得了处理他们个人数据的许可,将其转移给第三方,这一切都是幸福的,等等。

谁会失去工作?

我的最后一个故事是,每个人总是问50年后会发生什么:我们都会死,营销人员会失业......这里有营销人员担心失业,对吧? 一般来说,无需担心,因为任何高素质的人都不会失去工作。

Arthur Khachuyan:营销中的人工智能

无论创建什么算法,无论机器与我们这里的东西有多接近(指着他的头),如果它发展得足够快,这样的人永远不会闲着,因为必须有人创造这些创造性的东西做。 是的,有各种各样的“甘斯”,他们画看起来像人的图画并创作音乐,但这个地区的人仍然不太可能失业。

Arthur Khachuyan:营销中的人工智能

我有故事的所有内容,所以如果您有更多问题,可以提问。 谢谢。

Arthur Khachuyan:营销中的人工智能

主持人: – 朋友们,我们现在进入“问答”部分。 你举起手——我向你走来。

Arthur Khachuyan:营销中的人工智能

观众提问(XNUMX): – 关于“黑匣子”的问题。 他们表示,可以具体理解为什么某个用户会得到这样那样的结果。 这些是某种算法吗,还是每次都需要针对每个模型进行临时分析(作者注:“特别是为此”——拉丁语措辞单位)? 或者是否有现成的某种神经网络,粗略地说,可以具有商业意义?

哦: – 这里你需要了解以下几点:机器学习中有大量的任务。 比如有一个任务——回归。 对于回归,根本不需要神经网络。 一切都很简单:您有几个指标,您需要计算以下内容。 有些任务需要借助深度学习之类的东西。 事实上,在深度学习中,很难可靠地理解分配给哪些神经元的权重,但从法律上讲,您所需要的只是了解输入端有哪些数据以及输出端如何发挥作用。 这在法律上足以为这样的决定申请专利,并且足以理解这个故事是在什么基础上制作的。

这并不是说你因为两个月前在 Instagram 上拍了一张红头发的照片而访问了该网站,并看到了某种横幅。 如果开发人员没有在这个模型中包含这些数据的收集和头发颜色的标记,那么它就不会凭空出现。

如何销售机器学习系统的成果?

Z: – 这只是一个“什么”的问题:到底如何解释,如何向不懂机器学习的人推销。 我想说:我的模型显然是从头发颜色导致……嗯,头发颜色改变……这可能吗?

Arthur Khachuyan:营销中的人工智能

哦: - 也许是吧。 但从销售的角度来看,唯一可行的方案是:你有一个广告活动,我们用机器生成的受众取代受众 - 然后你就可以看到结果。 不幸的是,这是可靠地让客户相信这样的故事有效的唯一方法,因为市场上有很多解决方案曾经实施过但不起作用。

关于创建虚拟人格

Z: - 你好。 感谢您的讲座。 问题是:一个人由于某种原因不想跟随机器学习的引导,有什么机会通过与界面或某些人的交互为自己创造一个与自己的个性截然不同的虚拟个性?其他原因?

Arthur Khachuyan:营销中的人工智能

哦: – 有很多不同的插件专门处理随机行为。 有一个很酷的东西 - Ghostery,在我看来,它几乎完全将你隐藏在一堆不同的跟踪器中,而这些跟踪器无法记录这些信息。 但事实上,现在你所需要的只是社交网络上的一个封闭的个人资料,这样任何人、任何邪恶的爬虫都可以在那里收集任何东西。 安装某种扩展或自己编写一些东西可能会更好。

你看,这里的概念是,从法律上来说,比如个人数据是指可以识别你身份的数据,法律举例你的居住地址、年龄等等。 如今有无数的数据可以用来识别你的身份:相同的键盘笔迹、相同的按键、浏览器的数字签名……一个人迟早会犯错误。 他可以在“咖啡馆”的某个地方使用“Thor”,但最终,在一个好的时刻,要么 VPN 忘记打开,要么发生其他原因,在那一刻他就可以被识别出来。 所以最简单的方法是创建一个私人帐户并安装一些扩展。

市场正在走向只需按一个按钮即可获得结果的地步。

Z: - 谢谢你的故事。 一如既往,总是非常有趣(我在关注你)。 问题是:在创建对用户有利的系统(推荐系统)方面有何进展? 您说您曾经在开发一个推荐系统,用于寻找性伴侣、生活中的朋友(或者一个人可能喜欢的音乐)……这一切有多么有前途,您如何看待它的发展创建人们需要的系统的观点是什么?

哦: – 总的来说,市场正在发展到人们需要按一个按钮并立即获得他们需要的东西的地步。 就我创建约会应用程序的经验而言(顺便说一下,我们将在年底重新推出它),除了65%是已婚男性之外,最困难的推荐问题是向一个人提供多个模型在应用程序的开头 - “友谊”、“性”、“性友谊”和“商业”。 人们没有选择他们需要的东西。 男人来了并选择了“爱”,但实际上他们向所有人扔了裸体,等等。

问题是要找出一个不适合这些模型之一的人,并以某种方式顺利地把他带向另一个方向。 由于数据量很小,很难确定这是否是预测算法的错误,或者一个人是否不属于他的类别。 音乐也是如此:现在很少有真正有价值的算法能够很好地“facast”音乐。 也许是“Yandex.Music”。 有些人认为 Yandex.Music 算法很糟糕。 比如说,我喜欢她。 比如我个人不太喜欢YouTube的音乐算法等等。

当然,有一些微妙之处 - 一切都与许可证相关......但实际上,对此类系统的需求相当高。 曾经,Retail Rocket 公司因参与推荐系统的实施而闻名,但现在不知何故表现不佳——显然是因为他们很长时间没有开发自己的算法。 一切都朝着这个方向发展——直到我们进去,不按任何东西,得到我们需要的东西(并且变得完全愚蠢,因为我们选择的能力已经完全消失)。

影响力营销

Z: - 你好。 我的名字是康斯坦丁。 我想提出一个关于影响力营销的问题。 您知道有哪些系统可以让企业根据一些统计数据等为企业选择合适的博主吗? 这样做的理由是什么?

Arthur Khachuyan:营销中的人工智能

哦: – 是的,我会从远处开始,立即说所有这些技术的问题在于,营销中的所有人工智能现在就像走钢丝的人:左边是拥有很多钱的大公司,而在无论如何,一切都会对他们的工作有效,因为他们的广告活动只是针对观点; 另一方面,对于很多小企业来说这不起作用,因为他们拥有大量数据。 到目前为止,这些故事的适用性处于中间位置。

当已经有了良好的预算,并且任务是正确处理这些预算时(原则上,已经有相当多的数据)……我知道一些服务,比如 Getblogger,它们似乎有算法。 说实话,这些算法我没有研究过。 我可以告诉你,当我们需要给一些母亲送礼物时,我们用什么方法来寻找意见领袖。

我们使用称为内容分发时间的指标。 它的工作原理是这样的:你要分析一个人的受众,你需要系统地(例如,每 5 分钟一次)收集每个帖子的信息,谁喜欢它,评论过它,等等。 这样,您就可以了解受众中的每个人在什么时间点与您的内容进行互动。 对其受众的每个代表重复此操作,因此,使用内容传播的平均时间的度量,可以在这些人的大型网络图中进行着色,并使用此度量来构建集群。

例如,如果我们想要找到 15 位在某些 Woman.ru 上保持公众观点的母亲,这种方法就非常有效。 但这是一个相当复杂的技术实现(尽管纯粹理论上可以用Python完成)。 最重要的是,大型广告公司影响力营销的问题在于,他们需要大的、酷的、昂贵的博主,但他们不为狗屎工作。 现在,一个汽车品牌想要通过某个意见领袖来销售某些产品 - 他们需要使用汽车博主作为最后的手段,因为他们的受众要么已经购买了汽车,要么确切地知道他们想要什么样的汽车,只需坐下来看着很酷的汽车。 在这里,重要的是不要错过对人本身的受众的分析。

营销机器人

Z: – 告诉我,社交网络上的机器人对信息收集及其质量有多大影响?

Arthur Khachuyan:营销中的人工智能

哦: – 对于机器人来说这是一件非常有趣的事情。 廉价的机器人很容易识别 - 它们要么具有相同的内容,要么彼此是朋友,要么位于同一网络中。 还有一些方法可以处理复杂的机器人。 或者你问的问题是如何将一个人与他的假人联系起来?

Z: – 这么多垃圾信息能输出多少高质量的信息?

哦: – 这里的工作原理是这样的:由于存在大量数据(例如,用于某种营销研究),所有这些无赖都可以简单地扔掉。 也就是说,扔掉多一点的真人比捕获机器人要好,因为他们展示任何广告都是没有用的。 但是,如果您收集指标,例如与横幅或推荐系统的交互,则此类帐户可能会被丢弃。

现在在社交网络上,大约有百分之六的虚拟角色或只是废弃的页面或内向的人,算法将其“匹配”为机器人。 至于将一个人与他的假帐户联系起来,在这里,一切都与这个人迟早会犯错误的事实有关,而且行为模型是相同的 - 无论是他的真实帐户还是他的假帐户。 他们迟早会观看相同的内容或其他内容。

在这里,一切都不是取决于错误的百分比,而是取决于可靠地识别一个人所需的时间。 对于那些和 Instagram 生活在一起的人来说,可靠的识别时间只需五分钟。 对于一些人来说——六到八个月。

向谁以及如何出售数据?

Z: - 你好。 我有兴趣知道公司之间如何出售数据? 例如,我有一个应用程序,您可以(向开发人员)找出一个人去了哪里、他去了哪些商店以及他在那里花了多少钱。 我很想知道如何将我的受众数据出售给这些商店或将我的数据放入一个巨大的数据库并获得报酬?

Arthur Khachuyan:营销中的人工智能

哦: – 至于直接向某人出售数据,你和其他人都领先于 OFD——财政数据运营商,他们狡猾地将自己建立在支票转移和税务服务之间,现在正试图向所有人出售数据。 事实上,他们实际上摧毁了整个移动分析市场。 事实上,你可以嵌入你的应用程序,例如Facebook Pixel,它的DMP系统; 然后利用这些受众进行销售。 例如,“五月目标”像素。 我只是不知道你有什么样的观众,你需要了解。 但无论如何,您都可以集成到 Yandex 或 My Target,它们是最大的 DMP 系统。

这是一个相当有趣的故事。 唯一的问题是,你将所有流量都给了他们,而他们作为交易所,将承担这些流量的货币化。 他们可能会也可能不会告诉您有 10 个人使用过您的受众。 因此,要么建立自己的广告网络,要么屈服于大型 DMP。

谁会获胜——艺术家还是技术人员?

Z: – 一个离技术部分有点远的问题。 据说这是营销人员对即将到来的大规模失业的担忧。 创意营销(这些人似乎想出了鸡肉广告、大众汽车广告)和那些参与大数据的人(他们说:现在我们只需收集所有数据并向目标受众提供有针对性的广告)之间是否存在某种竞争斗争?大家)? 作为直接参与的人,您对谁会获胜有何看法——艺术家、技术人员,还是会产生某种协同效应?

Arthur Khachuyan:营销中的人工智能

哦: – 听着,好吧,他们一起工作。 工程师没有拿出创造力。 那些有创造力的人不会创造观众。 这里有某种多学科的故事。 现在真正的问题是那些坐着按按钮的人,那些做“猴子工作”、每天按同样的事情的人——这些人将会消失。

但分析数据的人自然会留下来,但必须有人处理这些数据。 必须有人想出这些图画,把它们画出来。 机器不可能有这样的创造力! 这完全是疯狂! 或者像 Carprice 的病毒式广告一样,顺便说一句,效果非常好。 请记住,YouTube 上有这样一个广告:“在 Carprice 上出售”,这绝对是疯狂的。 当然,任何神经网络都不会生成这样的故事。
总的来说,我支持这样一个事实:人们不会失去工作,而是会拥有更多一点的空闲时间,并且能够将这些空闲时间用于自我教育。

原始广告将消亡

Z: - 总的来说,显示的广告、横幅,甚至销售文字都没有写在那里:“你需要窗户 - 拿走它!”,“你需要别的东西 - 拿走它!”,也就是说,那里根本没有创造力。

哦: – 当然,这样的广告迟早会消失。 它会消亡,与其说是因为技术的发展,不如说是因为你我的发展。

最好将相关内容与不相关内容混合在一起

Z: - 我在这! 我对你所说的实验有疑问(使用推荐系统)。 在您看来,问题是那里签名的内容,为什么推荐它,还是用户看到的所有内容似乎都与他相关? 因为我读了一个针对母亲的实验,当时还没有那么多数据,也没有那么多来自互联网的数据,只有一家杂货零售商预测怀孕的数据(她们将成为母亲)。 当他们向准妈妈们展示一系列精选产品时,妈妈们都惊恐地发现,她们比任何官方消息都早发现了这些产品。 但它不起作用。 而为了解决这个问题,他们故意将相关产品与完全不相关的东西混合在一起。

Arthur Khachuyan:营销中的人工智能

哦: “我们专门向人们展示了提出建议的依据,以便了解他们的反馈。 实际上,这就是这个概念的诞生之处,即人们不需要被告知这些是与他超级相关的产品。

是的,顺便说一句,有一种方法可以将它们与不相关的混合在一起。 但也有相反的情况:有时人们会进来并与这种不相关的产品进行交互 - 随机异常值会出现,模型会崩溃,事情会变得更加复杂。 但这确实存在。 此外,许多公司故意,如果他们知道有人正在处理他们的数据(有人可以从他们那里窃取此类输出),他们有时会混淆它,以便他们以后可以证明你没有从其推荐系统中获取数据,而是从所谓的 Yandex.Market。

广告拦截器和浏览器安全

Z: - 你好。 您提到了 Ghostery 和 Adblock。 您能否告诉我们此类跟踪器的总体效果如何(也许基于统计数据)? 你们有没有收到公司的订单:他们说,确保我们的广告不会被Adblock关闭。

哦: – 我们不直接联系广告平台 – 正是这样他们就不会要求让每个人都看到他们的广告。 我个人使用 Ghostery——我认为这是一个非常酷的扩展。 现在所有浏览器都在为隐私而战:Mozilla 发布了一系列各种更新,Google Chrome 现在超级安全。 他们都竭尽全力阻止一切。 《Safari》甚至默认关闭了“陀螺仪”。
而这种趋势当然是好的(对于那些收集数据的人来说不是,尽管他们也从中脱身),因为人们首先屏蔽了cookie。 每个拥有广告网络的人都记得浏览器指纹这样一项奇妙的技术 - 这些算法接收 60 个不同的参数(屏幕分辨率、版本、安装的字体),并根据这些参数计算出唯一的“ID”。 让我们继续讨论这个。 浏览器开始为此苦苦挣扎。 总的来说,这将是一场永无休止的泰坦之战。

最新的开发者 Mozilla 是相当安全的。 它几乎不保存 cookie,并且生命周期很短。 尤其是如果你打开“隐身”,根本没有人会找到你。 问题是所有服务都需要输入密码,会很不方便。

心理分型和面相学在哪里起作用,在哪里不起作用?

Z: – 亚瑟,非常感谢你的演讲。 我也喜欢在 YouTube 上观看您的讲座。 您提到营销人员越来越多地使用心理分型和相貌分析。 我的问题是:这适用于哪些品牌类别? 我相信这只适合快速消费品。 比如,选择一辆车...

哦: – 我可以下载它确切的工作位置。 这适用于各种故事,如“Amediateka”、电视剧、电影等。 这在银行和银行产品中效果很好,如果它不是高端市场,而是各种学生卡、分期付款计划等。 这在快速消费品和各种 iPhone、充电器以及所有这些垃圾中确实非常有效。 这在“妈妈和流行”产品中效果很好。 虽然我知道在钓鱼中(有这样一个话题)......已经有好几次渔民的案例 - 他们永远无法可靠地分割。 我不知道为什么。 某种统计错误。

这对于驾车者、珠宝或某些家居用品不太适用。 事实上,它不适用于人们永远不会在社交媒体上写的事情 - 你可以这样检查。 传统上,购买洗衣机时:如何了解谁有洗衣机、谁没有? 好像每个人都有。 您可以使用 OFD 数据 - 查看谁使用收据购买了什么商品,并使用收据匹配这些人。 但事实上,有些事情你永远不会谈论,例如在 Instagram 上 - 处理这些事情很困难。

机器将技巧识别为统计填充。

Z: – 我有一个关于定位的问题。 是否有可能(或者突然存在)一个在所有事情上都自相矛盾的条件随机角色:首先他在谷歌上搜索“最好的健身房”,然后他在谷歌上搜索“10种无所事事的方法”? 凡事都是如此。 目标定位能否跟踪自相矛盾的事物?

哦: – 这里唯一的问题是:如果你已经使用谷歌两年了,告诉它你能告诉它关于你自己的一切,现在为自己安装一个插件来编写类似的随机查询,那么,当然,从统计数据中你会能够理解——你现在所做的事情是统计异常值,这都是筛选的问题。 如果您愿意,可以注册一个新帐户,但广告量不会改变。 她只会变得很奇怪。 虽然她还是很奇怪。

一些广告🙂

感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的内容? 通过下订单或推荐给朋友来支持我们, 面向开发人员的云 VPS,4.99 美元起, 我们为您发明的入门级服务器的独特模拟: VPS (KVM) E5-2697 v3(6 核)10​​4GB DDR480 1GB SSD 19Gbps XNUMX 美元或如何共享服务器的全部真相? (适用于 RAID1 和 RAID10,最多 24 个内核和最多 40GB DDR4)。

Dell R730xd 在阿姆斯特丹的 Equinix Tier IV 数据中心便宜 2 倍? 只有这里 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 电视低至 199 美元 在荷兰! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99 美元起! 阅读 如何建设基础设施公司同级使用价值730欧元的Dell R5xd E2650-4 v9000服务器一分钱?

来源: habr.com

添加评论