Артур Хачуян: штучний інтелект у маркетингу

Артур Хачуян - відомий російський фахівець із обробки великих даних, засновник компанії Social Data Hub (зараз Tazeros Global). Партнер НДУ ВШЕ. Підготував і представив спільно з НДУ ВШЕ законопроект щодо Big Data в Раді Федерації Виступав в інституті Кюрі в Парижі, СПБГУ, ФУ при Уряді РФ, Red Apple, International OpenDataDay, RIW 2016, AlfaFuturePeople.

Лекція записана на open-air фестивалі «Гік-пікнік» у Москві у 2019 році.

Артур Хачуян: штучний інтелект у маркетингу

Артур Хачуян (далі – АХ): – Якщо з величезної кількості галузей – з медицини, з будівництва, з чогось, чогось вибирати те, де технологія великих даних, машинного навчання, глибинного навчання найчастіше використовується, то це, мабуть, маркетинг. Тому що останні десь три роки все, що оточує нас у якихось рекламних комунікаціях, зараз зав'язано саме на аналіз даних і саме на тому, що можна назвати штучним інтелектом. Тому сьогодні розповідатиму вам про це з такої, дуже віддаленої історії…

Якщо уявляти штучний інтелект, як він виглядає – напевно, це щось таке. Дивна картинка є однією з нейросіток, які я написав рік тому для пошуку залежності того, чим займається мій собака - скільки разів їй потрібно сходити по-великому, по-маленькому, і як це взагалі залежить від того, скільки вона їсть, чи ні . Це жарт про те, як можна було уявити штучний інтелект.

Артур Хачуян: штучний інтелект у маркетингу

Але давайте подумаємо про те, як це все працює в рекламних комунікаціях. Існують три напрями того, як сучасні алгоритми саме в рекламі, маркетингу можуть з нами взаємодіяти. Зрозуміло, що перша історія спрямована на те, щоб отримати та отримати додаткові знання про нас з вами, а потім їх використати для якихось добрих і не дуже цілей; персоналізувати підхід до кожної конкретної людини; Звісно, ​​після цього сформувати певний попит у тому, щоб зробити головне цільове вплив і провести деяку продаж.

За допомогою технологій намагаються вирішити проблему ефективної комунікації.

Якщо вам скажу подумати, що спільного між «Порнхабом» і «М. Відео», про що ви подумаєте?

Коментарі із зали (далі – З): - Телевіки, аудиторія.

АХ: – Моя концепція в тому, що це – два місця, куди люди приходять за певним видом послуг, або назвемо це – за певним видом товарів. І ця аудиторія відрізняється тим, що вона нічого не хоче розповідати продавцеві. Вона хоче зайти і отримати те, що її цікавить у якомусь явному чи неявному вигляді. Звичайно, ніхто, приходячи в «М. Відео», не хоче спілкуватися ні з якими продавцями, не хоче розуміти, не хоче відповідати на жодне з їхніх питань.

Тому з цього випливає перша історія.

Коли з'явилися технології отримання додаткових знань для того, щоб якимось чином не спілкуватися з людиною. Нам усім подобається, коли ми дзвонимо до банку, і банк нам каже: «Здрастуйте. Олексію, ви наш віп-клієнт. Зараз із вами поговорить якийсь суперменеджер». Ви приходите до цього банку, і там справді є унікальний менеджер, який може з вами поговорити. На жаль чи на щастя, ще жодна компанія не здогадалася, як на тисячу клієнтів найняти тисячу персональних менеджерів; а оскільки більшість цих людей зараз перебуває в онлайні, завдання – зрозуміти, що це за людина і як правильно з нею комунікувати до того, як вона прийшла на якийсь рекламний ресурс. І тому власне з'явилися технології, які намагаються вирішити це завдання.

Вилучення даних – ось нова нафта

Уявимо, що ви - власник квіткового кіоску. До вас заходять троє людей. Перший дуже довго стоїть, мнеться, намагається з вами говорити, бере якийсь букет - ви йдете його завертати, виходите щось там робити; він із цим букетом тікає з кіоску – ви втратили свої три тисячі рублів. Чому так сталося? Ви нічого не знаєте про цю людину: ви не знаєте її історію приводів у МВС, ви не знаєте, що вона – клептоман, перебуває на обліку в психіатричному диспансері. Чому? Тому що ви його побачили вперше, і ви не фахівець із поведінкового аналізу.

Приходить ще якийсь… Віталій. Віталій теж дуже довго розбирається, каже: - Ну, ось, мені потрібно те, те. А ви йому кажете, – Квіти для мами, так? І продаєте йому букет.

Концепція тут у тому, щоб дізнатися достатню кількість даних, щоб зрозуміти, що цій людині взагалі потрібно. Усі одразу подумали про якісь рекламні мережі і так далі…

Усі неодноразово напевно чули безглузду фразу, що «дані – нова нафта»? Напевно, всі чули. Насправді дані люди навчили збирати досить давно, а от витягувати дані з цих даних – це завдання, яке зараз намагається вирішити штучний інтелект у маркетингу, або якісь статистичні алгоритми. Чому? Тому що, якщо ви поговорите з людиною, вона може вам дати правильну, неправильну, або якимось чином забарвлену відповідь. Жарт, який я розповідаю студентам – чим відрізняються опитування від статистики – я вам розповім у вигляді анекдоту:

Отже, у двох селах вирішили провести дослідження про середню довжину чоловічої гідності. Значить, у першому селі, Вілларібо, середня довжина – 15 сантиметрів, у селі Віллабаджо – 25. Знаєте чому? Бо у першому селі проводили виміри, а у другому – опитування.

Порноіндустрія – флагман рекомендаційних систем

Це те, чому сучасний підхід саме аналізу всіх людей поголовно, хай їх і трохи менше, ніж 100%, але це ті люди, яких не потрібно питати, на них не треба дивитися. Достатньо проаналізувати те, що зараз називається цифровим слідом, щоб зрозуміти, що цій людині потрібно, як з нею правильно говорити, як правильно сформувати попит навколо неї. З одного боку, це бездумна машина (але ми це з вами це чудово знаємо); ми не хочемо спілкуватися з людьми із «М. Відео», а тим більше, заходячи на такі ресурси, як «Порнхаб», ми хочемо отримати те, що нам потрібно.

Чому я завжди говорю про «Порнхаб»? Тому що adult-індустрія – перша, яка прийшла до аналізу подібних технологій, до впровадження подібних технологій, аналізу даних. Якщо ви візьмете три найпопулярніші бібліотеки в цій сфері (наприклад, TensorFlow або Pandas для «пітончика», для обробки csv-шек і так далі), якщо ви відкриєте на «Гітхабі», недовгим «гугленням» всі ці прізвища ви знайдете парочку людей , які або працювали, або на даний момент працюю в компанії «Порнхаб», і перші, хто займався впровадженням саме рекомендаційних систем. Взагалі, ця історія дуже просунута і показує, наскільки ця аудиторія, наскільки ця компанія пішла вперед.

Артур Хачуян: штучний інтелект у маркетингу

Три рівні ідентифікації

Навколо людини є великий набір даних, які можна ідентифікувати. Я зазвичай формально поділяю це на три рівні, поринаючи все глибше і глибше. Природно, компанія має власні дані.

Якщо, скажімо, ми говоримо про побудову рекомендаційної системи, то перший рівень – дані, що знаходяться біля самого магазину (історія покупок, різноманітні транзакції, те, як людина взаємодіяла з інтерфейсом).

Далі є рівень (щодо найбільшого) – це те, що називається відкритими джерелами. Не подумайте, що я закликаю вас парсити соцмережі, але за фактом те, що є у відкритих джерелах, відкриває величезний набір даних, які можна про людину сказати, дізнатися почерпнути.

І третя більшість – це оточення самої цієї людини. Так, існує думка, що якщо людини немає в соцмережах - про неї немає там жодних даних (ви напевно вже знаєте, що це не так), але найважливіше, що дані, які знаходяться у людини в профілі (або в якомусь додатку ) - це лише 40% знань, які можна отримати про нього. Решта інформації виходить із його оточення. Фраза «скажи мені, хто твій друг, і я скажу, хто ти» у XXI столітті набуває нового сенсу, тому що величезний масив даних можна отримати навколо цієї людини.

Якщо говорити ближче до рекламних комунікацій, то отримання рекламної комунікації не з реклами, а від якогось вашого друга, знайомої чи якось верифікованої людини – це дуже крута фішка, якою користується купа маркетологів. Коли вам раптово дарує безкоштовний промо-код якусь програму – ви робите про це пост і тим самим приваблюєте нову аудиторію. Насправді цей промо-код на умовне «Яндекс.Таксі» було обрано зовсім не випадковим чином, а для цього було проаналізовано величезну кількість даних про ваш потенціал залучити нову аудиторію та з нею якось взаємодіяти.

Артур Хачуян: штучний інтелект у маркетингу

Аналізують навіть поведінку героїв серіалів

Я вам покажу три малюнки, а ви скажіть, у чому між ними різниця.

Ось ця:

Артур Хачуян: штучний інтелект у маркетингу

Ця:

Артур Хачуян: штучний інтелект у маркетингу

І ось ця:

Артур Хачуян: штучний інтелект у маркетингу

Яка між ними різниця? Тут все просто. Як і квантової механіки, у разі цей креатив сформував спостерігач. Тобто різниця в одній і тій же рекламній кампанії, проведеній одним і тим же брендом в той самий час, лише в тому, хто дивився цей креатив. Особисто мені, коли заходжу на «Амедіатеку», досі показують кхала Дрого. Не знаю, що про мої уподобання думає «Амедіатека», але чомусь відбувається так.

Те, що зараз називається персоніфікованими комунікаціями – це найпопулярніша історія залучення аудиторії та правильної взаємодії з нею. Якщо на першому етапі ми визначили людей, використовуючи дані власного бренду, дані відкритих джерел і, наприклад, дані оточення цієї людини, ми, проаналізувавши її, можемо зрозуміти, хто вона, як правильно з нею розмовляти і, що найголовніше, якою мовою з ним розмовляти.

Тут технології пішли настільки далеко, що зараз аналізуються герої серіалів, на яких дивиться людина. Тобто ви лайкаєте серіали – вони [лайки] виглядають, переглядаються, з ким ви там взаємодіяли, щоб зрозуміти, яка особа підійде, щоб ви з ним провзаємодіяли. Звучить як повне марення, але ви заради інтересу на якомусь із ресурсів спробуйте – різні люди бачать різний креатив (для того, щоб правильно з ним взаємодіяти).

Жодне сучасне ЗМІ чи якийсь відеоресурс просто так не показує вам якісь новини. Заходьте на ЗМІ – завантажується величезна кількість алгоритмів, які ідентифікують вас, розуміють усю вашу попередню активність, роблять звернення до матмоделі, а потім показують вам щось. У цьому випадку тут ось така дивна історія.

Як визначають потреби? Психометрія. Фізіогноміка

Є дуже багато підходів (реальних) для визначення дійсних потреб людини та того, як правильно з ним комунікувати. Підходів багато, все вирішують по-різному, не можна сказати – який хороший, який поганий. Основні, здається, всі знають.

Артур Хачуян: штучний інтелект у маркетингу

Психометрія. Після історії з «Кембридж Аналітікс» вона прийняла якийсь шокуючий, на мою думку, якийсь оборот, тому що кожна друга зараз політична компанія приходить і каже: «Ой, а можете зробити мені, як у Трампа? Я теж хочу виграти, і таке інше». Насправді, це, звичайно, дурниці для наших реалій, наприклад, політичних виборів. Але для визначення психотипів використовуються три моделі:

  • перша заснована на контенті, який ви споживаєте – на словах, що ви пишете, на якійсь інформації, яку ви лайкаєте, відео тощо;
  • друга пов'язана на тому, як ви взаємодієте з веб-інтерфейсом, як ви друкуєте, які кнопочки затискаєте - дійсно, є цілі компанії, які за клавіатурним почерком вміють досить достовірно визначати те, що зараз називається психотипами.
  • Я ось – не дуже психолог, досконально погано розумію, як це працює, але з погляду рекламних комунікацій аудиторії, розбиті на ці сегменти, працюють дуже добре, бо комусь потрібно показати червоний екран із синьою жінкою, комусь – темно -синій фон з якоюсь абстракцією, і це працює дуже круто. На якихось низьких рівнях – настільки, що людина навіть не думає про це. Нині основна проблема яка на рекламному ринку? Усі – агенти спецслужб, всі ховаються, у всіх встановлено мільйон тисяч дозволів для браузерів, щоб їх ніяк не ідентифікували – у вас напевно стоять «Адблоки», «Гострі» та всілякі програми, які блокують відстеження. Через це дуже складно щось розуміти про людину. А технології пішли далі – потрібно не просто знати, що ця людина повернулася на ваш сайт у 125-й раз, а що вона ще така дивна людина.

Фізіогноміка – дуже спірна наука. Її навіть наукою не рахують. Це група людей, які раніше програмували детектори брехні для якогось МВС, а зараз займається, як то кажуть, персоніфікацією креативу. Підхід тут дуже простий: береться кілька ваших публічних фотографій з яких-небудь соцмереж, по них будується тривимірна геометрія. І якщо ви юрист, то зараз скажете, що це особа та персональні дані; а я вам скажу, що це 300 тисяч точок, що знаходяться у просторі, і це не особа, і персональними даними не є. Так зазвичай говорять усі, коли до них приходить Роскомнагляд.

Але якщо серйозно, окремо ваша особа, якщо там не підписано ім'я та прізвище, вашими персональними даними не є. Суть у тому, що хлопці розмічають різні риси осіб, що впливають на те, як людина приймає рішення, як правильно з нею взаємодіяти. Десь це працює погано, у якихось сегментах реклами; у яких сегментах це працює дуже добре. Зрештою, виходить так, що саме заходячи на якийсь ресурс, ви бачите не один банер, який показують усім, а, наприклад… зараз нормально робити 16 або 20 варіантів під різні аудиторії, – і це працює дуже круто. Так, це ще сумніше з погляду споживача, тому що людьми починають маніпулювати все сильніше та сильніше. Але з погляду бізнесу це працює дуже добре.

«Чорна скринька» машинного навчання

Це породжує таку проблему подібних технологій: все-таки більшість розробників зараз те, що називається глибинним навчанням, є «чорним ящиком». Якщо ви колись занурювалися в цю історію і спілкувалися з розробниками, вони завжди кажуть: «Ой, слухайте, ну ми там щось накодили таке незрозуміле, і не знаємо, як це працює». Можливо, у когось таке було.

Це насправді не так. Те, що зараз називається машинним навчанням – далеко не «чорна скринька». Є безліч підходів, що дозволяють описати вхідні та вихідні дані, і врешті-решт компанія досконально може зрозуміти, на підставі яких ознак машина вирішила показати вам цей порнографічний ролик або інший. Питання в тому, що ніхто з компаній це ніколи не розкриває, тому що: по-перше, комерційна таємниця; по-друге, там виявиться величезна кількість даних, про які ви навіть не підозрювали.

Наприклад, раніше на дискусії з етики ми обговорювали те, як соціальні мережі аналізують особисті повідомлення для того, щоб тегувати людей в якісь рекламні історії. Пишіть ви комусь щось – на підставі цього отримуєте певний тег для, власне, якихось рекламних комунікацій. І ви це ніколи не доведете, і, мабуть, немає сенсу доводити це. Проте, якби подібні моделі розкривалися, вони були б. Виходить так, що ринок побудови подібних рекомендаційних систем вдає, що не знає, чому це сталося.

Люди не хочуть знати, що про них знають

А друга історія - у тому, що клієнт ніколи не хоче дізнатися, чому він отримав саме це оголошення, саме цей продукт. Я розповім вам таку історію. Мій перший досвід комерційного впровадження рекомендаційних систем на подібних алгоритмах саме заради дослідження був у 2015 році у дуже великій мережі секс-шопів (так, теж не особливо приємна історія).

Артур Хачуян: штучний інтелект у маркетингу

Клієнтам було запропоновано наступне: вони заходять, авторизуються своєю соціальною мережею, десь через 5 секунд отримують повністю персоніфікований магазин для них, тобто всі товари змінилися – вони потрапляють у певну категорію і так далі. Знаєте, наскільки збільшилась конверсія цього магазину? Ні на скільки! Люди заходили і одразу тікали з нього. Вони заходили та розуміли, що їм запропоновано саме те, про що вони думали…

Проблема цього тесту була в тому, що під кожним товаром було написано, чому вам запропонували саме це («бо ви перебуваєте в прихованій групі «Владна жінка шукає мужика-«ганчірку»). Тому сучасні рекомендаційні системи ніколи не показують ті дані, на підставі яких було зроблено предикт.

Дуже популярна історія – це ЗМІ, тому що всі вони використовують такі рекомендаційні системи. Раніше алгоритми були дуже прості: дивіться категорію «Політика» – вам показують новини з категорії «Політика». Зараз все настільки складно, що аналізуються ті місця, де ви зупинили мишку, на яких словах ви сконцентрувалися, що ви скопіювали, як взагалі провзаємодіяли з цією сторінкою. Потім аналізує лексика самих повідомлень: ага, ви не просто новини про Путіна читаєте, а в певному ключі, з якимсь певним емоційним забарвленням. І коли людина отримує якусь новину, вона навіть не замислиться над тим, як вона сюди прийшла. Проте потім із цим контентом взаємодіє.

Все це, природно, спрямоване на те, щоб утримати бідного, нещасного чоловічка, який отже божеволіє від величезного масиву інформації, яка навколо нього знаходиться. Тут треба сказати, що добре використовувати подібні системи для персоніфікації креативу навколо себе, збору якоїсь інформації, але, на жаль, поки таких сервісів немає.

Штучний інтелект ловить клієнта на зльоті та формує попит

І тут виникає одне дуже цікаве філософське питання, переходячи від створення рекомендаційної системи до формування попиту. Рідко хтось про нього замислюється, але коли ви намагаєтеся запитати у умовного «Інстаграма», – «Навіщо ви збираєте дані? Чому не показувати мені абсолютно рандомну рекламу?», – «Інстаграм» вам скаже: «Друже, це все зроблено, щоб тобі показувати саме те, що тобі цікаво». Мовляв, ми настільки точно хочемо дізнатися тебе, щоб показати тобі саме те, що ти шукаєш.

Артур Хачуян: штучний інтелект у маркетингу

Але технологія давно переступила цей страшний рубіж, і подібні технології вже давно не пророкують те, що вам потрібно. Вони (увага!) формують попит. Це, мабуть, найстрашніша річ, яка крутиться навколо штучного інтелекту у подібних комунікаціях. Страшна вона в тому, що вона використовується останні 3-5 років майже повсюдно - від гуглової видачі до яндексової видачі, до якихось систем ... Гаразд, не про "Яндекс" нічого поганого говорити; та гарного.

Суть у чому? Давно вже подібні рекламні комунікації уникнули стратегії, коли ви пишите – «хочу купити дитяче крісло», і бачите сто тисяч мільйонів публікацій. Вони перейшли до наступного: тільки жінка виклала фотографію з ледве видимим животом, чоловіка вже одразу почнуть переслідувати повідомлення – «Мужик, скоро пологи. Купи дитяче крісло».

Тут резонно ви запитаєте, чому за таких гігантських здобутків технологій ми досі бачимо таку говенну рекламу в соціальних мережах? Проблема в тому, що на цьому ринку досі все вирішують гроші, тому одного разу може прийти якийсь рекламодавець на кшталт «Кока-Коли» і сказати: «Ось вам 20 мільйонів – покажіть мої гівно-банери всьому інтернету». І вони справді це зроблять.

Але якщо ви зробите якийсь чистий аккаунт і протестуєте, наскільки точно подібні алгоритми вас вгадують: вони спочатку намагаються вгадати вас, а потім починають вам щось наперед робити. А людський мозок працює таким чином, що, отримуючи достовірну для нього інформацію, він навіть не опрацьовує момент, чому він цю інформацію отримав. Перше правило визначити, що ви уві сні – потрібно зрозуміти, як ви сюди прийшли. Людина ніколи не пам'ятає моменту, як він опинився в якомусь приміщенні. Тут те саме.

Google може почати формувати вашу думку

Такі дослідження проводили кілька зарубіжних компаній, що займаються i-трекінгом. Вони ставили на спеціальні комп'ютери девайси, які записують, куди дивляться піддослідні очі. Брала від п'яти до семи тисяч добровольців, які просто скролили стрічку, взаємодіяли з соцмережами, рекламою, а вони записували інформацію, на яких частинах банерів, креативів ці люди зупиняють погляд.

І вийшло, що коли люди отримують такий надперсоніфікований креатив, вони навіть не замислюються про це – вони відразу переходять, починають із цим взаємодіяти. З погляду бізнесу це добре, але з погляду нас, як користувачів, це не дуже круто, тому що – всього чого бояться? - Що одного разу умовний «Гугл» може почати (може, звичайно, і не почати) формувати свій світогляд. Він може завтра, наприклад, людям почати показувати новини про те, що земля пласка.

Жарт жартом, але їх ловили безліч разів, що під час виборів вони починають певним людям давати певну інформацію. Ми всі звикли, що пошукова система дістає чесно. Але, як я завжди говорю, якщо хочете дізнатися насправді, як влаштований світ – напишіть свою власну пошукову систему, без фільтрів, без уваги на копірайт, без ранжирування якихось ваших друзів у видачі. Видача реальних даних в інтернеті взагалі відрізняється від того, що показують Гугл, Яндекс, Бінг і так далі. Якісь матеріали ховаються, бо друзі, колеги, вороги чи ще хтось (або колишній коханець, з ким ти переспав) – не має значення.

Як переміг Трамп

Коли були останні вибори США, проводилося дуже просте дослідження. Вони брали за тими самими запитами у різних місцях, з різних «айпишників», з різних міст, різні люди гуглили те саме. Умовно запит був у стилі: хто переможе на виборах? І дивним чином результати таким чином були побудовані, що в тих штатах, де найбільша кількість людей намагалася голосувати не за того кандидата, вони отримували якісь добрі новини про кандидата, якого просував Гугл. Якого? Ну, тут відомо якого – того, який президентом став. Це абсолютно недоказова історія, і всі ці дослідження пальцем по воді. "Гугл" може сказати: "Хлопці, все це зроблено для того, щоб ми показували максимально релевантний контент для вас".

Ви з цього моменту повинні знати, що те, що називається максимально релевантним - це ні фіга не так. Компанія називає релевантним те, що потрібно вам продати з якихось хороших чи поганих причин.

Тих, хто не має грошей зараз, вже готують до майбутніх покупок

Тут ще такий цікавий момент, про який я розповім. Величезна кількість активної аудиторії зараз у соціальних мережах, у додатках – це молодь. Назвемо так її – неплатоспроможна молодь: діти 8-9 років, які кликають у дебільні ігри, це – 12-13-14, які лише реєструються у соціальних мережах. Навіщо величезні компаніям витрачати величезні бюджети та ресурси на те, щоб створювати додатки для неплатоспроможної аудиторії, яка ніколи не монетизується? У той час, коли ця аудиторія стане платоспроможною, про неї буде достатній обсяг даних, щоб дуже добре прогнозувати її поведінку.

Артур Хачуян: штучний інтелект у маркетингу

Зараз будь-якого націлення запитай, яка найскладніша аудиторія? Вони скажуть: високоприбуткова. Тому що продати, наприклад, квартиру вартістю 150 мільйонів карбованців через соціальні мережі практично неможливо. Поодинокі випадки, коли ви робите якусь рекламу на 10 тисяч чоловік, один купує цю квартиру – у клієнта успіх… Але один із десяти тисяч з погляду статистики – це повна хрень. Тож чому складно визначити високоприбуткову аудиторію? Тому що люди, які зараз є членами високоприбуткової аудиторії, були народжені, коли інтернет ще був зовсім маленьким, коли Артемія Лебедєва ще ніхто не знав, і про них немає жодної інформації. Неможливо передбачити їхню модель поведінки, неможливо зрозуміти, хто для них є лідерами думки, з яких джерел контент вони приймають.

Тому, коли ви всі через 25 років станете мільярдерами, а компанія, яка збирається вам щось продавати, матиме величезну кількість даних. Тому зараз з'явився чудовий GDPR у Європі, який перешкоджає збиранню даних неповнолітніх.

Природно, це ні дуля не працює на практиці, оскільки всі діти все одно грають в мамині, татові акаунти - таким чином інформація збирається. Коли дасте дитині наступного разу планшет, подумайте про це.

Абсолютно не страшне якесь антиутопічне майбутнє, коли всі помруть у війні з машинами – абсолютно реальна історія зараз. Є безліч компаній, які займаються створенням алгоритмів психопрофілювання людей після того, як вони грають в ігри. Дуже цікава галузь. На підставі цього всього люди потім сегментуються, щоб із ними потім якось комунікувати.

Артур Хачуян: штучний інтелект у маркетингу

Передбачення поведінки цих людей буде доступним через 10-15 років – саме в той момент, коли вони стануть платоспроможною аудиторією. Що найголовніше, ці люди вже заздалегідь дали дозвіл на обробку своїх персональних даних, передачу їх третім особам і все це щастя, і так далі.

Хто втратить роботу?

І остання в мене історія про те, що всі завжди запитують, що буде через 50 років: ми всі помремо, чи буде безробіття у маркетологів... Є тут маркетологи, які переживають за безробіття, так? Переживати взагалі не варто, бо будь-яка висококваліфікована людина роботу не втратить.

Артур Хачуян: штучний інтелект у маркетингу

Які б алгоритми не були створені, наскільки сильно машина не підібралася б до того, що в нас знаходиться тут (вказує на голову), якщо це буде розвиватися досить швидко, подібні люди ніколи не залишаться без діла, тому що креативи ці комусь доведеться робити. Так, є всілякі «гани», які малюють картинки, схожі на людей, музику створюють, але навряд чи колись у цій сфері люди втратить свою роботу.

Артур Хачуян: штучний інтелект у маркетингу

У мене з історією все, так що можете запитувати, якщо у вас є ще. Дякую.

Артур Хачуян: штучний інтелект у маркетингу

ведучий: – Друзі, ми зараз переходимо до блоку «Питання – відповідь». Ви підіймаєте руку – я до вас підходжу.

Артур Хачуян: штучний інтелект у маркетингу

Питання із зали (З): – Питання про «чорну скриньку». Говорили, що можна конкретно зрозуміти, чому саме такий результат щодо такого користувача. Це якісь алгоритми, чи це щоразу кожної моделі ad hoc (прим. автора: «спеціально цього» – латинський фразеологізм) потрібно розбирати? Чи вже готові, для якоїсь нейросітки можна зрозуміти, грубо кажучи, бізнес-сенс?

АХ: – Тут треба розуміти таке: у машинному навчанні є безліч завдань. Наприклад, є завдання – регресія. Для регресії взагалі жодних нейромереж не потрібно. Там все просто: у вас є кілька показників, вам потрібно прорахувати такі. Є завдання, де потрібно вдаватися до такої штуки, як глибинне навчання. Дійсно, в глибинному навчанні складно достовірно зрозуміти, які ваги до яких нейрончиків були встановлені, але юридично все, що вам необхідно зрозуміти, які дані були на вході, як вони відіграли на виході. Цього достатньо юридично для того, щоб запантентувати подібне рішення і цього достатньо для того, щоб зрозуміти, на підставі чого було прийнято історію.

Немає такого, що ви зайшли на сайт і вам показали якийсь банер тому, що ви два місяці тому з червоним волоссям сфотографувалися в Інстаграм. Якщо розробник не закладе збір цих даних, розмітку кольору волосся на цю модель, то воно зі стелі не візьметься.

Як продавати результати систем машинного навчання?

З: - Просто питання в чому: саме зрозуміти, як пояснити, продати комусь, хто не розуміється на машинному навчанні. Я хочу сказати: моя модель - від кольору волосся чітко веде до ... ось колір волосся змінюється ... Це можливо чи ні?

Артур Хачуян: штучний інтелект у маркетингу

АХ: - Можливо да. Але з погляду продажу спрацює єдина схема: у вас є рекламна кампанія, ми замінюємо аудиторію на ту, яку формує машина – і ви просто дивитеся результат. Це, на жаль, єдиний варіант достовірно замовника переконати в тому, що подібна історія працює, тому що на ринку купа рішень, які колись були впроваджені, і вони не працювали.

Про створення віртуальної особистості

З: - Вітаю. Дякую за лекцію. Питання таке: а який шанс є у людини, яка з якоїсь причини не хоче йти на поводу у машинного навчання, створити собі віртуальну особистість, яка кардинально відрізняється від її власної особистості, за допомогою взаємодії з інтерфейсом чи з якихось інших причин?

Артур Хачуян: штучний інтелект у маркетингу

АХ: - Є купа різних плагінів, які займаються саме рандомізацією поведінки. Є крута штука – Ghostery, яка, на мою думку, майже повністю тебе приховує від купи різних трекерів, які потім не можуть записувати цю інформацію. Але за фактом зараз вам достатньо буде закритого профілю в соціальних мережах, щоб ніхто ніякі злі парсери там нічого не зібрали. Краще, напевно, поставити якесь розширення чи написати щось самому.

Розумієте, тут така концепція, що юридично, наприклад, персональними даними називаються дані, за якими вас можна ідентифікувати, і в законі наведено як приклад адресу місця проживання, вік тощо. Зараз даних, за якими вас можна ідентифікувати - безліч: той же клавіатурний почерк, те ж натискання, цифровий підпис браузера ... Рано чи пізно, людина помиляється. Він може десь у «кафесі» сидіти через «Тор», але зрештою одного разу або VPN забуде включити, або ще щось, і в цей момент його можна буде ідентифікувати. Так що найпростіше зробити закритий аккаунт і поставити якесь розширення.

Ринок йде до того, що потрібно натиснути лише одну кнопку для отримання результату

З: - Спасибі за розповідь. Як завжди, дуже цікаво завжди (я за вами стежу). Питання таке: який прогрес у сенсі створення систем позитивних для користувачів, рекомендаційних систем? Ви говорили, що свого часу займалися рекомендаційними системами для пошуку партнера статевого, друга життя (або музика, яка потенційно може сподобатися людині)… Наскільки все це перспективно, і як ви бачите його розвиток саме з точки зору створення потрібних людям систем?

АХ: - Взагалі ринок йде до того, що людям потрібно натиснути одну кнопочку і відразу отримати те, що потрібно. Що стосується мого досвіду створення додатків для знайомств (ми його, до речі, наприкінці року перезапустимо), там, окрім того, що 65% було одружених мужиків, найскладніша рекомендаційна проблема була в тому, що людині на старті додатка пропонувалося кілька моделей – « Дружба», «Секс», «Секс-дружба» та «Бізнес». Люди обирали не те, що їм потрібне. Чоловіки приходили вибирали «Кохання», а насправді вони кидали всім оголенці, та й так далі.

Проблема була в тому, щоб ідентифікувати людину, яка не підходить одній з цих моделей, і її якось плавно взяти і перемістити в інший бік. Через малу кількість даних визначити, чи це помилка алгоритму прогнозування, чи людина перебуває над своєї категорії – дуже складно. Те саме з музикою: дуже мало зараз реально гідних алгоритмів, які добре «факастять» музику. Можливо, «Яндекс.Музика». Хтось вважає алгоритм «Яндекс.Музики» поганим. Мені вона, приміром, подобається. Мені особисто, наприклад, не подобається алгоритм «Ютуб»-музики тощо.

Там є, звичайно, свої тонкощі – там все зав'язано на ліцензіях… Але реально попит на такі системи досить великий. Свого часу була відома компанія "Рітейл Рокет", яка займалася впровадженням рекомендаційних систем, зараз вона якось не дуже добре живе - мабуть, тому що вони довго свої алгоритми не розвивали. Все йде до цього – щоб ми зайшли і, нічого не натискаючи, отримали те, що нам потрібно (і повністю отупіли, тому що вміння вибирати у нас повністю зникло).

Influence-маркетинг

З: - Вітаю. Мене звуть Костянтин. Я хотів би порушити питання з приводу influence-маркетингу. Чи знаєте ви якісь системи, які дозволяють бізнесу підібрати бізнесу відповідного йому блогера за якимись даними статистики і так далі? І за якими ознаками це робиться?

Артур Хачуян: штучний інтелект у маркетингу

АХ: - Так, я зараз почну здалеку і відразу скажу, що проблема подібних усіх технологій у тому, що весь цей штучний інтелект у маркетингу зараз як канатоходець йде: зліва знаходяться великі компанії, у яких купа бабла, і у них у будь-якому випадку буде ефективно все працювати, тому що у них рекламні кампанії спрямовані просто на перегляди; з іншого боку, є купа дрібного бізнесу, у якого це не буде працювати, тому що у них даних багато. Поки що застосовність цих історій десь посередині.

Коли є вже хороші бюджети, і завдання ці бюджети правильно обробляти (і даних вже, в принципі, досить багато)… Я знаю пару сервісів, на кшталт «Гетблогера», в яких начебто є алгоритми. Я, щиро кажучи, ці алгоритми не вивчав. Можу вам розповісти, який підхід використовуємо ми для пошуку лідерів думок, коли потрібно якимось мамам подарувати подарунок.

Ми використовуємо метрику, яка називається «Час розповсюдження контенту». Працює це так: ви берете людину, чию аудиторію ви аналізуєте, і вам потрібно на кожну посаду планомірно (напр., раз на 5 хвилин) збирати інформацію, хто її залайкав, закоментував і так далі. Таким чином можна буде зрозуміти, в який момент часу кожна людина з аудиторії провзаємодіяла з його контентом. Повторити цю операцію для кожного представника його аудиторії, і таким чином, використовуючи метрику середнього часу розповсюдження контенту, її можна, наприклад, у великому мережевому графі цих людей кинути у колір та використовувати цю метрику для побудови кластерів.

Це працює досить добре, якщо ми хочемо, наприклад, знайти 15 мам, які тримають свою громадську думку на якомусь woman.ru. Але це досить складна технічна реалізація (хоча суто теоретично можна і на Пітоні це зробити). Суть у тому, що проблема influence-маркетингу у великих рекламних агентствах – їм потрібні великі, круті, дорогі блогери, які ні хрону не працюють. Ось, автобренд хоче через якогось лідера думок продати якийсь товар - їм використовувати автоблогер потрібно в останню чергу, тому що аудиторія таких або вже купила автомобіль, або точно знає, який автомобіль вона хоче просто сидить дивиться на круті тачки. Тут важливо ще не прогаяти аналіз аудиторії самої людини.

Роботи маркетингу

З: - Підкажіть, як сильно боти в соціальних мережах впливають на збір інформації та її якість?

Артур Хачуян: штучний інтелект у маркетингу

АХ: - З ботами така цікава штука. Дешевих роботів досить легко ідентифікувати – у них або контент однаковий, або вони у друзях один у одного знаходяться, або вони знаходяться в єдиній сітці. Зі складними ботами є теж підходи. Чи ви питаєте завдання, як людину до її фейку прив'язати?

З: – Наскільки якісна інформація буде на виході з усім цим сміттям?

АХ: - Тут це працює таким чином: через те, що даних величезна кількість (наприклад, для якогось маркетингового дослідження), всю цю шушеру можна просто викинути. Тобто краще викинути трохи більше реальних людей, ніж захопити ботів, бо їм марно показувати будь-яку рекламу. Але якщо збирати метрику, наприклад, взаємодії з банерами чи рекомендаційними системами, такі облікові записи можна викинути.

Зараз у соціальних мережах відсотків шість віртуальних персонажів чи просто покинутих сторінок чи інтровертів, яких алгоритми «метчать» як ботів. Що стосується прив'язки людини до її фейку, тут теж все зав'язано на тому, що людина рано чи пізно припуститься помилки, і штука в тому, що модель поведінки однакова - що у його реального акаунту, що у його фейка. Рано чи пізно вони той самий контент подивляться або ще щось.

Тут все зводиться не до відсотка похибки, а до кількості часу, яка потрібна для достовірної ідентифікації людини. Для когось, хто живе зі своїм Інстаграмом, це час достовірної ідентифікації, зводиться до п'яти хвилин. Для когось – до шести-восьми місяців.

Кому та як продати дані?

З: - Вітаю. Мені цікаво дізнатися, як відбувається продаж даних між компаніями? Наприклад, у мене є додаток, в якому можна дізнатися (розробнику), куди ходить людина, до яких магазинів і скільки там витрачає грошей. І мені цікаво дізнатися, як, припустімо, продати цим магазинам дані про свою аудиторію або вкинути свої дані в одну величезну базу даних і отримати за це гроші?

Артур Хачуян: штучний інтелект у маркетингу

АХ: - Щодо продати комусь безпосередньо дані - вас, всіх інших, випередили ОФД - оператори фіскальних даних, які хитрим чином вбудувалися між передачею чеків та Податковою і зараз намагаються продавати всім дані. Справді, вони обвалили цілий ринок мобільної аналітики. По факту ви можете вбудувати вашу програму, наприклад піксель «Фейсбука», його DMP-система; потім використовувати цю аудиторію у тому, щоб продавати. Наприклад, піксель "Май Таргета". Не знаю просто, що за аудиторія у вас потрібно зрозуміти. Але в будь-якому випадку ви можете інтегруватися або в "Яндекс", або "Май Таргет", що є найбільшими DMP-системами.

Це досить цікава історія. Проблема лише в тому, що ви їм весь трафік віддасте, і монетизацію цього трафіку вони, як біржі, беруть на себе. Вони можуть сказати вам, що вашою аудиторією скористалося 10 осіб, а можуть і не сказати. Тому або ви будуєте свою рекламну мережу або віддаєтеся на відкуп великим DMP.

Хто переможе – художник чи технар?

З: – Питання, трохи віддалене від технічної частини. Було сказано про страхи маркетологів з приводу майбутнього масового безробіття. Чи є якась конкурентна боротьба між креативним маркетингом (ось ці хлопці, які вигадали рекламу з куркою, реклама «Фольксвагена», здається) та тими, хто займається «Біг датою» (які кажуть: ми зараз просто зберемо всі дані та таргетовану рекламу всім доставимо )? Як людина, яка безпосередньо займається, яка ваша думка, хто переможе – художник, технар, чи це буде синергетичний ефект?

Артур Хачуян: штучний інтелект у маркетингу

АХ: - Слухайте, ну вони працюють разом. Інженери не вигадують креатив. Ті, хто креативіт, не вигадує аудиторію. Тут якась мультидисциплінарна історія. Реально проблеми зараз у тих, хто сидить і кнопочки натискає, у тих, хто робить «манки-джоб», щодня натискає одне й те саме – ось такі люди пропадуть.

Але ті, хто аналізує дані, природно залишаться, але хтось ці дані повинен обробляти. Хтось повинен буде вигадувати ці малюнки, малювати їх. Подібний креатив не вигадає ж машина! Це повне безумство! Або, наприклад, вірусна реклама «Карпрайс», яка, до речі, дуже добре працювала. Пам'ятаєте, така була на «Ютубі»: «Продай у «Карпрайс» — абсолютно божевільна. Звичайно, ніяка нейросітка подібну історію не згенерує.
Я взагалі прихильник того, що не люди втратять роботу, а у них трохи більше вільного часу, і вони цей вільний час зможуть витратити на самоосвіту.

Примітивна реклама помре

З: – За великим рахунком реклама, яка демонструється, банери – там же за великим рахунком навіть тексти, що продають, не пишуться: «Потрібні вікна – бери!», «Потрібно ще щось – бери!», тобто там взагалі ніякого креативу немає.

АХ: – Така реклама помре, звичайно, рано чи пізно. Вона помре не так через розвиток технологій, а скільки через розвиток нас з вами.

Релевантне краще перемішувати з нерелевантним

З: - Я тут! У мене питання щодо експерименту, який, як ви сказали, у вас не вийшло (з рекомендаційною системою). А на вашу думку, проблема в тому, що там було підписано, чому рекомендується, або в тому, що все, що бачив користувач, як би було йому релевантно? Тому що я читала експеримент для мам, і там ще не було стільки даних і там ще не було стільки даних з інтернету, просто були дані продуктового рітейлера - передбачав вагітність (що вони будуть мамами). І коли вони показували добірку товарів для майбутніх мам, мами жахалися від того, що про них це дізналися до якихось офіційних речей. І це не працювало. І для того, щоб вирішити цю проблему, вони навмисне перемішували релевантні товари з чимось нерелевантним.

Артур Хачуян: штучний інтелект у маркетингу

АХ: – Ми спеціально людям показали, на підставі чого зроблено рекомендації, щоб зрозуміти їхній зворотний зв'язок. Власне, звідси й народилася концепція, що людям не треба казати, що це якісь суперрелевантні товари для нього.

Так, до речі, підхід перемішувати їх із нерелевантними є. Але тут є обернена штука: іноді заходять люди, і вони з цим нерелевантним товаром взаємодіють - виходять випадкові викиди, моделі ламаються і відбувається все ще складніше. Але таке є насправді. Більше того, багато компаній спеціально, якщо знають, що хтось обробляє їх дані (хтось може в них вкрасти подібну видачу), вони спеціально її іноді перемішують для того, щоб можна було потім довести, що ви взяли дані не зі своєї рекомендаційної системи, а з умовного «Яндекс.маркету».

Блокувальники реклами та браузерна безпека

З: - Вітання. Ти згадував про Ghostery та Adblock. Чи можеш взагалі розповісти, наскільки такі трекери взагалі ефективні (може, за статистикою)? І чи були в тебе якісь замовлення від компаній: мовляв, зроби так, щоби нашу рекламу не можна було закрити «Адблоком».

АХ: – Ми безпосередньо з рекламними платформами не зв'язуємось – саме через те, щоб вони не просили зробити так, щоб їхню рекламу бачили всі. Я особисто користуюся Ghostery – вважаю дуже круте розширення. Зараз же всі браузери борються за приватність: «Мозілла» випустила купу всіляких оновлень, «Гугл Хром» супер-секьюрний тепер. Вони всі блокують все, що тільки можна. "Сафарі" вже навіть "Гіроскоп" за замовчуванням відключив.
І цей тренд, звісно, ​​добрий (не для тих, хто збирає дані, хоч і вони теж викрутилися), бо люди спочатку заблокували «куки». Усі, хто володів рекламними мережами, згадали про таку чудову технологію, як фінгерпринти браузера – це алгоритми, які отримують 60 різних параметрів (дозвіл екрану, версія, встановлені шрифти) і на підставі їх вираховують унікальний «айдишник». Перейшли на це. А браузери почали боротися з цим. Загалом це буде нескінченна битва титанів.

Остання девелоперська "Мозила" досить захищена. Вона ніякі «куки» не зберігає, встановлює малий час життя. Особливо, якщо включити Інкогніто, тебе взагалі ніхто не знайде. Питання в тому, що незручно буде вводити у всіх сервісах паролі.

Де працює і не працюють психотипування та фізіогноміка?

З: – Артуре, дякую за лекцію. Теж із задоволенням стежу за твоїми лекціями на «Ютубі». Ти згадав про те, що маркетологи найчастіше вдаються до того, щоб використовувати психотипування, фізіогноміку. У мене питання: у яких категоріях брендів це працює? Моє переконання – це тільки FMCG підходить. Наприклад, автомобіль вибирати – це…

АХ: – Можу завантажити, де це точно працює. Це працює у будь-яких історіях на кшталт «Амедіатеки», серіалах, фільмах тощо. Це добре працює у банках та банківських продуктах, якщо це не преміальний сегмент, а всякі студентські картки, розстрочки – ось такі речі. Це справді дуже добре працює у FMCG і у всяких «Айфонах», зарядках, у всій цій чебурді. Це добре працює в «маминих» товарах, «татових». Хоча знаю, що в рибальстві (є така тема)… Кілька разів були кейси з рибалками – їх ніколи не вдається достовірно сегментувати. Не знаю чому. Якась помилка статистична.

Це погано працює з автомобілістами, з біжутерією, з речами для дому. По суті, це погано працює з тим, що люди ніколи не написали б у соціальні мережі – можна так це перевірити. Умовно, з покупкою пральною машиною: ось як зрозуміти, хто має пральну машину, а хто – ні? Начебто вона у всіх є. Можна використовувати дані ОФД - по чеках подивитися, хто що купував, по чеках "помітити" цих людей. Але за фактом такі речі, про які ти ніколи не розповів би, наприклад, в Інстаграмі – з такими речами працювати складно.

Машини розпізнають хитрощі як статистичні вкидання.

З: - У мене питання про націлення. Чи можливе існування (або раптом вони існують) умовного рандомного персонажа, який у всьому суперечить собі: на початку він глухить «кращі спортзали», а потім глухить «10 способів нічого не робити»? І так у всьому. Чи може націлення встежити за таким, що сам собі суперечить?

АХ: – Тут питання тільки ось у чому: якщо ви 2 роки користувалися «Гуглом», розповіли йому про себе все, що тільки можна, а зараз встановіть собі плагін, який подібні рандомні запити буде писати, то, звичайно ж, за статистикою можна буде зрозуміти - Те, що ви робите зараз - це статистичний викид, і все це справа відсіяти. Якщо ви бажаєте – зареєструйте новий обліковий запис, але обсяг реклами не зміниться. Вона просто дивною стане. Хоча вона й досі дивна.

Небагато реклами 🙂

Дякую, що залишаєтеся з нами. Вам подобаються наші статті? Бажаєте бачити більше цікавих матеріалів? Підтримайте нас, оформивши замовлення або порекомендувавши знайомим, хмарні VPS для розробників від $4.99, унікальний аналог entry-level серверів, який був винайдений нами для Вас: Вся правда про VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps від $19 чи як правильно ділити сервер? (Доступні варіанти з RAID1 і RAID10, до 24 ядер і до 40GB DDR4).

Dell R730xd вдвічі дешевше в дата-центрі Equinix Tier IV в Амстердамі? Тільки в нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТБ від $199 у Нідерландах! Dell R420 – 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB – від $99! Читайте про те Як побудувати інфраструктуру корп. класу із застосуванням серверів Dell R730xd Е5-2650 v4 вартістю 9000 євро за копійки?

Джерело: habr.com

Додати коментар або відгук