Артър Хачуян: изкуствен интелект в маркетинга

Артур Хачуян е известен руски специалист по обработка на големи данни, основател на компанията Social Data Hub (сега Tazeros Global). Партньор на Национален изследователски университет Висше училище по икономика. Подготви и представи съвместно с Националния изследователски университет „Висше училище по икономика“ законопроект за големите данни в Съвета на федерацията.Той говори в Института Кюри в Париж, Държавния университет в Санкт Петербург, Федералния университет към правителството на Руската федерация, в Red Apple, Международен OpenDataDay, RIW 2016, AlfaFuturePeople.

Лекцията е записана на фестивала на открито „Geek Picnic“ в Москва през 2019 г.

Артър Хачуян: изкуствен интелект в маркетинга

Артур Хачуян (по-нататък - AH): – Ако от огромен брой индустрии – от медицина, от строителство, от нещо, нещо, да изберете тази, в която най-често се използва технологията за големи данни, машинно обучение, дълбоко обучение, тогава това вероятно е маркетингът. Защото през последните три и нещо години всичко, което ни заобикаля в някакви рекламни комуникации, вече е обвързано точно с анализ на данни и точно с това, което може да се нарече изкуствен интелект. Затова днес ще ви разкажа за това от толкова далечна история...

Ако си представите изкуствения интелект и как изглежда, вероятно е нещо подобно. Странната картина е една от невронните мрежи, които написах преди година, за да намеря зависимостта от това, което моето куче прави - колко пъти трябва да отиде голямо, малко и как по принцип зависи от това колко яде или не?. Това е шега за това как може да се измисли изкуственият интелект.

Артър Хачуян: изкуствен интелект в маркетинга

Но все пак нека помислим как работи всичко това в рекламните комуникации. Има три начина, по които съвременните алгоритми в рекламата и маркетинга могат да взаимодействат с нас. Ясно е, че първата история е насочена към получаване и извличане на допълнителни знания за вас и мен, и след това да ги използва за някакви добри и не толкова добри цели; персонализирайте подхода към всеки конкретен човек; Естествено, след това създайте определено търсене, за да изпълните основното целево действие и да извършите определена продажба.

Използвайки технологиите, те се опитват да решат проблема с ефективната комуникация

Ако ви кажа да помислите какво правят Pornhub и M. Видео”, какво си мислите?

Коментари от публиката (наричана по-долу C): - Телевизия, публика.

ОХ: – Моята концепция е, че това са две места, където хората идват за определен вид услуга или да го наречем определен тип стоки. И тази публика е различна по това, че не иска да каже нищо на продавача. Тя иска да влезе и да получи това, което я интересува в някаква явна или скрита форма. Естествено, никой не идва при М. Видео” не иска да комуникира с никакви продавачи, не иска да разбира, не иска да отговаря на нито един техен въпрос.

Следователно първата история следва от всичко това.

Когато се появиха технологии за получаване на допълнителни знания, за да се избегне по някакъв начин комуникация с човек. Всички обичаме, когато се обадим в банката и банката ни каже: „Здравейте. Алексей, ти си наш VIP клиент. Сега някой супер мениджър ще говори с вас. Идвате в тази банка и наистина има уникален мениджър, който може да говори с вас. За съжаление или за щастие, нито една компания все още не е измислила как да наеме хиляда лични мениджъри за хиляда клиенти; и тъй като повечето от тези хора сега са онлайн, задачата е да разберете какъв човек е това и как да общувате с него правилно, преди да дойде на някакъв рекламен ресурс. И затова всъщност се появиха технологии, които се опитват да решат този проблем.

Извличането на данни е новото масло

Нека си представим, че сте собственик на щанд за цветя. Трима души идват да те видят. Първият стои много дълго, колебае се, опитва се да ви заговори, взема някакъв букет - отивате да го опаковате, излизате да правите нещо там; той бяга от щанда с този букет - загубихте своите три хиляди рубли. защо стана така Вие не знаете нищо за този човек: не знаете историята му на арести в МВР, не знаете, че е клептоман и се води в психиатричен диспансер. Защо? Защото го виждате за първи път и не сте поведенчески анализатор.

Идва някой друг... Виталий. Виталий също отнема много време, за да го разбере, той казва: „Е, имам нужда от това и това.“ И ти му казваш: „Цветя за мама, нали?“ И ти му продаваш букет.

Концепцията тук е да се намерят достатъчно данни, за да се разбере от какво всъщност се нуждае човекът. Всички веднага се сетиха за някакви рекламни мрежи и така нататък...

Вероятно всеки е чувал глупавата фраза, че „данните са новото масло“ повече от веднъж? Със сигурност всички са чували. Всъщност хората са се научили да събират данни преди доста време, но извличането на данни от тези данни е задачата, която изкуственият интелект в маркетинга или някакъв вид статистически алгоритми сега се опитват да решат. Защо? Защото, ако говорите с човек, той може да ви даде правилен, грешен или някак оцветен отговор. Шегата, която разказвам на моите ученици, е как проучванията се различават от статистиката. Ще ви разкажа това като анекдот:

Това означава, че в две села са решили да направят проучване за средната продължителност на мъжеството. Това означава, че в първото село, Виларибо, средната дължина е 15 сантиметра, в село Вилабаджо - 25. Знаете ли защо? Защото в първото село се правеха измервания, а във второто се правеше проучване.

Порно индустрията е флагманът на системите за препоръки

Ето защо съвременният подход е да се анализират всички хора без изключение, дори и да са малко под 100%, но това са хората, които не е нужно да питате, не е нужно да ги гледате. Достатъчно е да анализирате това, което сега се нарича цифров отпечатък, за да разберете от какво има нужда този човек, как да говорите с него правилно, как правилно да създадете търсене около него. От една страна, това е безмозъчна машина (но вие и аз знаем това много добре); не искаме да общуваме с хора от М. Видео“ и още повече, когато отидем на ресурси като Pornhub, искаме да получим точно това, от което се нуждаем.

Защо винаги говоря за Pornhub? Защото индустрията за възрастни е първата, която стига до анализа на такива технологии, до внедряването на такива технологии, до анализа на данни. Ако вземете трите най-популярни библиотеки в тази област (например TensorFlow или Pandas за Python, за обработка на CSV файлове и т.н.), ако го отворите в Github, с кратък Google на всички тези имена ще намерите няколко души, които или са работили, или в момента работят в компанията Pornhub, и са първите, които внедриха системи за препоръки там. Като цяло тази история е много напреднала и показва колко тази публика, колко тази компания е тръгнала напред.

Артър Хачуян: изкуствен интелект в маркетинга

Три нива на идентификация

Около човек има огромен набор от данни, които могат да бъдат идентифицирани. Обикновено формално разделям това на три нива, задълбочавайки се все по-дълбоко. Естествено, компанията разполага със собствени данни.

Ако, да речем, говорим за изграждане на система за препоръки, тогава първото ниво са данните, които се намират в самия магазин (история на покупките, всички видове транзакции, как човек е взаимодействал с интерфейса).

Следва ниво (сравнително най-голямото) - това е, което се нарича отворени източници. Не си мислете, че ви насърчавам да изтривате социалните мрежи, но всъщност това, което е налично в отворени източници, отваря огромен набор от данни, които можете, да речем, да научите за даден човек.

И третата основна част е средата на самия този човек. Да, има мнение, че ако човек не е в социалните мрежи, там няма данни за него (сигурно вече знаете, че това не е вярно), но най-важното е, че данните, които са в профила на човек (или в някое приложение) е само 40% от знанията, които могат да бъдат получени за него. Останалата информация се получава от неговото обкръжение. Фразата „кажи ми кой е твоят приятел и аз ще ти кажа кой си“ придобива ново значение в XNUMX век, защото около този човек може да се получи огромно количество данни.

Ако говорим по-близо до рекламни комуникации, тогава получаването на рекламни комуникации не от реклама, а от някой приятел, познат или по някакъв начин проверен човек е много готина функция, която много търговци използват. Когато някое приложение изведнъж ви даде безплатен промо код, вие правите публикация за него и по този начин привличате нова аудитория. Всъщност този промо код за условното „Yandex.Taxi“ не е избран случайно, но за това беше анализирано огромно количество данни за вашия потенциал да привлечете нова аудитория и по някакъв начин да взаимодействате с тях.

Артър Хачуян: изкуствен интелект в маркетинга

Те дори анализират поведението на герои от телевизионни сериали

Ще ви покажа три снимки, а вие ми кажете каква е разликата между тях.

Този:

Артър Хачуян: изкуствен интелект в маркетинга

Това:

Артър Хачуян: изкуствен интелект в маркетинга

И това също:

Артър Хачуян: изкуствен интелект в маркетинга

Каква е разликата между тях? Тук всичко е просто. Както в квантовата механика, в този случай тази креативност е формирана от наблюдателя. Тоест разликата в една и съща рекламна кампания, провеждана от една и съща марка по едно и също време, е само в това кой е гледал този криейтив. Лично аз като ходя в Амедиатека пак показват Хал Дрого. Не знам какво мисли Amediateka за моите предпочитания, но по някаква причина това се случва.

Това, което сега се нарича персонализирана комуникация, е най-популярната история за привличане на аудитория и правилно взаимодействие с нея. Ако на първия етап сме идентифицирали хора, използвайки данни за нашата собствена марка, данни с отворен код и например данни от средата на този човек, ние, след като го анализираме, можем да разберем кой е той, как да говорим с него правилно и най-важното , какъв език говори говори с него.

Тук технологиите са стигнали толкова далеч, че героите в телевизионните сериали, които хората гледат, сега се анализират. Тоест, харесвате сериали - гледат се [харесванията], гледат с кого сте общували там, за да разберат с какъв човек е подходящ да общувате. Звучи като пълна глупост, но просто за забавление, опитайте го на един от ресурсите - различните хора виждат различни рекламни послания (за да взаимодействат правилно с него).

Нито една съвременна медия или какъвто и да е видео ресурс просто не ви показва новини. Отидете до медиите - заредени са огромен брой алгоритми, които ви идентифицират, разбират цялата ви предишна дейност, обръщат се към математическия модел и след това ви показват нещо. В този случай има такава странна история.

Как се определят нуждите? Психометрия. Физиономия

Има много (реални) подходи за определяне на действителните нужди на човек и как да общувате правилно с него. Има много подходи, всичко се решава по различен начин, не може да се каже кое е добро и кое е лошо. Главните май знаят всичко.

Артър Хачуян: изкуствен интелект в маркетинга

Психометрия. След историята с Cambridge Analytics се получи някакъв шокиращ, според мен, някакъв обрат, защото всяка втора политическа компания сега идва и казва: „О, можете ли да ме направите като Тръмп? Аз също искам да спечеля и така нататък.” Всъщност това, разбира се, е глупост за нашите реалности, например политически избори. Но за определяне на психотипите се използват три модела:

  • първият е базиран на съдържанието, което консумирате – думите, които пишете, някаква информация, която харесвате, видеоклипове и т.н.;
  • второто е свързано с това как взаимодействате с уеб интерфейса, как пишете, кои бутони натискате - наистина има цели компании, които въз основа на почерка на клавиатурата си могат доста надеждно да определят това, което сега се нарича психотипове.
  • Не съм кой знае какъв психолог, не разбирам много как става, но от гледна точка на рекламните комуникации аудиториите, разделени на тези сегменти, работят много добре, защото на някого трябва да се покаже червен екран със син жена, на някой трябва да се покаже тъмен екран - син фон с някаква абстракция и работи много готино. На някои ниски нива - толкова много, че човек дори не мисли за това. Какъв е основният проблем на рекламния пазар сега? Всеки е агент на разузнаването, всеки се крие, всеки има инсталирани милиони хиляди разрешения за браузър, за да не бъде идентифициран по никакъв начин - вероятно имате „Adblocks“, „Gostrey“ и всякакви приложения, които блокират проследяването. Поради това е много трудно да се разбере нещо за човек. И технологията върви напред - трябва не само да знаете, че този човек се е върнал на вашия сайт за 125-ти път, но и че той е такъв и толкова странен човек.

Физиогномиката е много противоречива наука. Дори не се смята за наука. Това е група хора, които програмираха детектори на лъжата за някакво МВР, а сега се занимават с това, което се нарича олицетворение на творчеството. Подходът тук е много прост: няколко от вашите публични снимки са взети от някои социални мрежи и от тях се изгражда триизмерна геометрия. И ако сте юрист, сега ще кажете, че това е човек и лични данни; но ще ви кажа, че това са 300 хиляди точки, разположени в пространството, и това не е човек и не са лични данни. Това обикновено казват всички, когато Роскомнадзор дойде при тях.

Но сериозно, вашето лице отделно, ако името и фамилията ви не са подписани там, не са ваши лични данни. Въпросът е, че момчетата маркират различни черти на лицето, които влияят върху това как човек взема решения и как да взаимодейства правилно с него. В някои области това работи зле, в някои рекламни сегменти; в кои сегменти работи много добре. В крайна сметка се оказва, че когато отидете на някакъв ресурс, виждате не само един банер, който се показва на всички, но например... сега е нормално да направите 16 или 20 опции за различни аудитории - и това работи много яко. Да, това е още по-тъжно от гледна точка на потребителя, защото хората започват да бъдат манипулирани все повече и повече. Но въпреки това от бизнес гледна точка работи много добре.

Черната кутия на машинното обучение

Това поражда следния проблем с такива технологии: в крайна сметка за повечето разработчици сега това, което се нарича дълбоко обучение, е „черна кутия“. Ако някога сте се потапяли в тази история и сте разговаряли с разработчиците, те винаги казват: „О, слушайте, добре, ние сме кодирали нещо толкова неразбираемо там и не знаем как работи.“ Може би на някой се е случвало това.

Това всъщност е далеч от истината. Това, което сега се нарича машинно обучение, далеч не е „черна кутия“. Има огромен брой подходи за описание на входните и изходните данни и в крайна сметка компанията може напълно да разбере въз основа на какви признаци машината е решила да ви покаже това или друго порнографско видео. Въпросът е, че никоя от компаниите никога не разкрива това, защото: първо, това е търговска тайна; второ, ще има огромно количество данни, за които дори не сте знаели.

Например, преди това, в дискусия за етиката, обсъдихме как социалните мрежи анализират лични съобщения, за да маркират хората в някакви рекламни истории. Ако напишете нещо на някого, на базата на това получавате специфичен таг за всъщност някаква рекламна комуникация. И никога няма да го докажеш и вероятно няма смисъл да го доказваш. Въпреки това, ако подобни модели бяха разкрити, те биха съществували. Оказва се, че пазарът за изграждане на подобни препоръчителни системи се прави, че не знае защо това се е случило.

Хората не искат да знаят какво знаят хората за тях

И втората история е, че клиентът никога не иска да знае защо е получил точно тази реклама, този конкретен продукт. Ще ви разкажа тази история. Първият ми опит в комерсиалното внедряване на системи за препоръки, базирани на подобни алгоритми, именно с цел проучване, беше през 2015 г. в много голяма мрежа от секс магазини (да, също не особено неприятна история).

Артър Хачуян: изкуствен интелект в маркетинга

На клиентите се предлагаше следното: влизат, влизат в социалната си мрежа и след около 5 секунди получават напълно персонализиран магазин за тях, тоест всички продукти са сменени - попадат в определена категория и т.н. . Знаете ли колко се е увеличил процентът на реализация на този магазин? В никакъв случай! Хората влязоха и веднага избягаха от него. Влязоха и разбраха, че им се предлага точно това, за което си мислеха...

Проблемът с този тест беше, че под всеки продукт беше написано защо ви е предложен точно този („защото сте член на скритата група „Властната жена търси мъж, който е изтривалка“). Следователно съвременните системи за препоръки никога не показват данните, въз основа на които е направена „прогнозата“.

Много популярна история са медиите, защото всички те използват подобни системи за препоръчване. Преди това алгоритмите бяха много прости: погледнете категорията „Политика“ - и ви показват новини от категорията „Политика“. Сега всичко е толкова сложно, че анализират местата, на които сте спрели мишката, върху какви думи сте се концентрирали, какво сте копирали, как изобщо сте взаимодействали с тази страница. След това анализира лексиката на самите съобщения: да, вие не просто четете новини за Путин, но по определен начин, с определена емоционална окраска. И когато човек получи някаква новина, той дори не мисли как е дошъл тук. Въпреки това той взаимодейства с това съдържание.

Всичко това, естествено, има за цел да задържи бедния, нещастен човечец, който вече полудява от огромното количество информация, която е около него. Тук трябва да се каже, че би било хубаво да използвате такива системи, за да персонализирате креатива около вас и да съберете някаква информация, но за съжаление все още няма такива услуги.

Изкуственият интелект хваща клиента във въздуха и създава търсене

И тук възниква един много интересен философски въпрос, преминавайки от създаване на система за препоръки към създаване на търсене. Рядко някой се замисля за това, но когато се опитате да попитате така наречения Instagram: „Защо събирате данни? Защо да не ми покаже абсолютно произволна реклама?“ - Instagram ще ви каже: „Приятелю, всичко това е направено, за да ви покаже точно това, което е интересно за вас.“ Искаме да ви познаваме толкова точно, че да можем да ви покажем какво точно търсите.

Артър Хачуян: изкуствен интелект в маркетинга

Но технологиите отдавна са преминали този ужасен праг и подобни технологии вече не предсказват от какво имате нужда. Те (внимание!) създават търсене. Това е може би най-страшното нещо, което се върти около изкуствения интелект в подобни комуникации. Страшното е, че се използва почти навсякъде през последните 3-5 години - от резултатите от търсенето в Google до резултатите от търсенето на Yandex, до някои системи... Добре, няма да кажа нищо лошо за Yandex; и добре.

Какъв е смисълът? Измина много време, откакто подобни рекламни комуникации се отдалечиха от стратегията, при която пишете „Искам да си купя детско столче“ и виждате сто хиляди милиона публикации. Те преминаха към следното: щом жената публикуваше снимка с едва видимо коремче, съпругът й веднага започваше да бъде последван от съобщения: „Човече, скоро ще се роди. Купете си детско столче."

Тук може с основание да попитате защо, при такъв гигантски напредък на технологиите, все още виждаме такава скапана реклама в социалните мрежи? Проблемът е, че на този пазар всичко все още се решава от парите, така че в един хубав момент някой рекламодател като Coca-Cola може да дойде и да каже: „Ето ви 20 милиона - покажете моите скапани банери на целия Интернет.“ И наистина ще го направят.

Но ако си направиш някаква чиста сметка и тестваш колко точно те познават такива алгоритми: те първо се опитват да те познаят, а след това започват да ти правят нещо предварително. И човешкият мозък работи по такъв начин, че когато получава достоверна за него информация, той дори не обработва момента, в който е получил тази информация. Първото правило, за да определите, че сте насън, е да разберете как сте дошли тук. Човек никога не помни момента, в който е попаднал в определена стая. Тук е същото.

Google може да започне да оформя вашия мироглед

Такива проучвания са извършени от няколко чуждестранни компании, които се занимават с i-tracking. Те инсталираха устройства на специални компютри, които записват накъде гледат очите на изпитвания. Взех от пет до седем хиляди доброволци, които просто превъртаха емисията, взаимодействаха със социалните мрежи, с рекламите и записваха информация за това кои части от банерите и рекламните послания са спрели очите си тези хора.

И се оказва, че когато хората получат такъв хиперперсонализиран криейтив, те дори не се замислят за това - те веднага продължават напред, започват да взаимодействат с него. От бизнес гледна точка това е добре, но от гледна точка на нас, като потребители, това не е много готино, защото - от какво се страхуват? – Че в един прекрасен момент условният „Гугъл“ може да започне (или, разбира се, да не започне) да формира свой мироглед. Утре например може да започне да показва на хората новини, че земята е плоска.

Шегувам се, но толкова пъти са ги хващали, че по време на избори започват да дават определена информация на определени хора. Всички сме свикнали с факта, че търсачката получава всичко честно. Но, както винаги казвам, ако наистина искате да знаете как работи светът, напишете своя собствена търсачка, без филтри, без да обръщате внимание на авторските права, без да класирате някои от приятелите си в резултатите от търсенето. Показването на реални данни в интернет обикновено е различно от това, което се показва от Google, Yandex, Bing и т.н. Някои материали са скрити, защото приятели, колеги, врагове или някой друг (или бивш любовник, с когото сте спали) - няма значение.

Как Тръмп спечели

Когато имаше последните избори в Съединените щати, беше проведено много просто проучване. Те взеха едни и същи заявки на различни места, от различни IP адреси, от различни градове, различни хора намериха в Google едно и също нещо. Условно запитването беше в стил: кой ще спечели изборите? И учудващо, резултатите бяха конструирани по такъв начин, че в тези щати, където най-голям брой хора се опитаха да гласуват за грешния кандидат, те получиха добри новини за кандидата, популяризиран от Google. Кое? Е, ясно кой – този, който стана президент. Това е абсолютно недоказуема история и всички тези изследвания са пръст във водата. Google може да каже: „Момчета, всичко това е направено, за да покажем най-подходящото съдържание за вас.“

Отсега нататък трябва да знаете, че това, което се нарича максимално релевантно, абсолютно не е така. Компанията нарича уместно нещо, което трябва да ви бъде продадено по някаква добра или лоша причина.

Тези, които сега нямат пари, вече се подготвят за бъдещи покупки

Тук има още един интересен момент, за който ще ви разкажа. Огромен брой активни аудитории сега в социалните мрежи и в приложенията са млади хора. Да го наречем така - неплатежоспособна младеж: деца на 8-9 години, които играят глупави игри, това са 12-13-14, които тепърва се регистрират в социалните мрежи. Защо огромни компании ще харчат огромни бюджети и ресурси, за да създават приложения за неплащаща аудитория, която никога не се монетизира? В момента, в който тази аудитория стане платежоспособна, ще има достатъчно данни за нея, за да се предвиди нейното поведение много добре.

Артър Хачуян: изкуствен интелект в маркетинга

Сега попитайте всеки таргетолог, коя е най-трудната аудитория? Те ще кажат: високодоходно. Защото продажбата например на апартамент на стойност 150 милиона рубли чрез социалните мрежи е почти невъзможна. Има единични случаи, когато правиш някаква реклама на 10 хиляди души, един купува този апартамент - клиентът е успех... Но един на десет хиляди от статистическа гледна точка е пълна глупост. И така, защо е трудно да се идентифицира аудитория с високи доходи? Защото хората, които сега са членове на високодоходоносна аудитория, са родени, когато интернет все още е бил много малък, когато още никой не е познавал Артемий Лебедев и няма информация за тях. Невъзможно е да се предвиди моделът им на поведение, невъзможно е да се разбере кои са техните лидери на мнение и от какви източници на съдържание получават.

Така че, когато всички станете милиардери след 25 години, и компаниите, които ще ви продадат нещо, ще разполагат с огромно количество данни. Ето защо сега имаме чудесен GDPR в Европа, който предотвратява събирането на данни от непълнолетни.

Естествено, това изобщо не работи на практика, тъй като всички деца все още играят в сметките на майка си и баща си - така се събира информация. Следващият път, когато дадете на детето си таблет, помислете за това.

Абсолютно не някакво страшно, дистопично бъдеще, когато всички ще умрат във война с машини - абсолютно реална история сега. Има огромен брой компании, които създават алгоритми за психопрофилиране на хора въз основа на това как играят игри. Много интересна индустрия. Въз основа на всичко това след това хората се сегментират, за да може по някакъв начин да се общува с тях.

Артър Хачуян: изкуствен интелект в маркетинга

Прогноза за поведението на тези хора ще има след 10-15 години – точно в момента, в който те станат платежоспособна публика. Най-важното е, че тези хора вече са дали предварително разрешение да обработваме личните им данни, да ги предаваме на трети страни и всичко това е щастие и т.н.

Кой ще загуби работата си?

И последната ми история е, че всеки винаги пита какво ще се случи след 50 години: всички ще умрем, ще има безработица за търговците... Тук има търговци, които се притесняват от безработицата, нали? Като цяло няма място за притеснение, защото всеки висококвалифициран човек няма да остане без работа.

Артър Хачуян: изкуствен интелект в маркетинга

Каквито и алгоритми да се създават, колкото и да се доближава машината до това, което имаме тук (посочва главата си), ако се развива достатъчно бързо, такива хора никога няма да останат бездействащи, защото някой ще трябва да създаде тези креативни неща направи. Да, има всякакви „групи“, които рисуват картини, които приличат на хора и създават музика, но все пак е малко вероятно хората в тази област някога да загубят работата си.

Артър Хачуян: изкуствен интелект в маркетинга

Имам всичко с историята, така че можете да задавате въпроси, ако имате още. Благодаря ти.

Артър Хачуян: изкуствен интелект в маркетинга

Модератор: – Приятели, сега преминаваме към блока „Въпроси и отговори“. Вдигаш ръка - идвам при теб.

Артър Хачуян: изкуствен интелект в маркетинга

Въпрос от публиката (XNUMX): – Въпрос за „черната кутия“. Те казаха, че е възможно конкретно да се разбере защо е получен такъв и такъв резултат за такъв и такъв потребител. Дали това са някакви алгоритми или трябва да се анализира всеки път за всеки модел ad hoc (бел. на автора: „специално за това“ - латинска фразеологична единица)? Или има готови такива за някаква невронна мрежа, която, грубо казано, може да има бизнес смисъл?

ОХ: – Тук трябва да разберете следното: в машинното обучение има огромен брой задачи. Например има задача - регресия. За регресията изобщо не са необходими невронни мрежи. Всичко е просто: имате няколко показателя, трябва да изчислите следното. Има задачи, при които е необходимо да се прибегне до такова нещо като дълбоко обучение. Наистина, при задълбочено обучение е трудно да се разбере надеждно какви тегла са били присвоени на кои неврони, но законно всичко, от което се нуждаете, е да разберете какви данни са били на входа и как са се изиграли на изхода. Това е достатъчно юридически, за да се патентова подобно решение и е достатъчно, за да се разбере на какво основание е направена историята.

Не е като да сте отишли ​​на сайта и да ви е бил показан някакъв вид банер, защото сте направили снимка с червена коса в Instagram преди два месеца. Ако разработчикът не включи събирането на тези данни и маркирането на цвета на косата в този модел, тогава той няма да се появи от нищото.

Как да продаваме резултатите от системите за машинно обучение?

Я: – Въпросът е само какво: как точно да обясня, как да продам на някой, който не разбира машинното обучение. Искам да кажа: моят модел ясно води от цвета на косата до... е, промени в цвета на косата... Това възможно ли е или не?

Артър Хачуян: изкуствен интелект в маркетинга

ОХ: - Може би да. Но от гледна точка на продажбите ще работи единствената схема: имате рекламна кампания, заменяме аудиторията с тази, генерирана от машината – и просто виждате резултата. Това, за съжаление, е единственият начин надеждно да убедите клиента, че подобна история работи, защото на пазара има много решения, които някога са били внедрени и не са работили.

За създаването на виртуална личност

Я: - Здравейте. Благодаря за лекцията. Въпросът е какъв шанс има човек, който по някаква причина не иска да последва примера на машинното обучение, да създаде за себе си виртуална личност, която е коренно различна от собствената му личност, чрез взаимодействие с интерфейса или за някои друга причина?

Артър Хачуян: изкуствен интелект в маркетинга

ОХ: – Има куп различни плъгини, които се занимават конкретно с произволно поведение. Има готино нещо - Ghostery, което според мен почти напълно ви скрива от куп различни тракери, които след това не могат да запишат тази информация. Но всъщност сега ви трябва само затворен профил в социалните мрежи, за да не може никой, никакви зли стъргалки да събират нещо там. Вероятно е по-добре да инсталирате някакво разширение или да напишете нещо сами.

Виждате ли, концепцията тук е, че правно, например, лични данни се отнасят до данни, чрез които можете да бъдете идентифицирани, а законът дава като пример вашия адрес на пребиваване, възраст и т.н. В днешно време има безброй данни, по които можете да бъдете идентифицирани: еднакъв почерк на клавиатурата, една и съща преса, цифров подпис на браузъра... Рано или късно човек греши. Той може да е някъде в „кафене“, използвайки „Тор“, но накрая в един хубав момент или VPN ще забрави да се включи, или нещо друго и в този момент той може да бъде идентифициран. Така че най-лесният начин е да си направите частен акаунт и да инсталирате някакво разширение.

Пазарът се движи към точката, в която трябва да натиснете само един бутон, за да получите резултати.

Я: - Благодаря за разказа. Както винаги, винаги много интересно (следвам те). Въпросът е: какъв напредък има по отношение на създаването на системи, които са положителни за потребителите, системи за препоръки? Казахте, че навремето сте работили върху система за препоръки за намиране на сексуален партньор, приятел в живота (или музика, която човек потенциално може да хареса)... Колко обещаващо е всичко това и как виждате развитието му от гледната точка за създаване на системи, от които хората се нуждаят?

ОХ: – Като цяло пазарът върви към момента, в който хората трябва да натиснат един бутон и веднага да получат това, което им трябва. Що се отнася до моя опит в създаването на приложения за запознанства (между другото, ще го пуснем отново в края на годината), в допълнение към факта, че 65% бяха женени мъже, най-трудният проблем с препоръката беше, че на човек бяха предложени няколко модела в началото на приложението - „Приятелство“, „Секс“, „Секс приятелство“ и „Бизнес“. Хората не са избрали това, което им трябва. Мъжете дойдоха и избраха „Любов“, но в действителност хвърлиха голота на всички и т.н.

Проблемът беше да се идентифицира човек, който не отговаря на един от тези модели, и някак плавно да го вземете и да го преместите в другата посока. Поради малкото данни е много трудно да се определи дали това е грешка в алгоритъма за прогнозиране или човек не е в неговата категория. Същото е и с музиката: сега има много малко наистина достойни алгоритми, които могат да „предават“ музика добре. Може би „Yandex.Music“. Някои хора смятат, че алгоритъмът на Yandex.Music е лош. Аз например я харесвам. Аз лично, например, не харесвам музикалния алгоритъм на YouTube и т.н.

Има, разбира се, някои тънкости - всичко е обвързано с лицензи... Но в действителност търсенето на такива системи е доста голямо. По едно време беше известна компанията Retail Rocket, която се занимаваше с внедряването на системи за препоръки, но сега някак си не се справя много добре - очевидно защото дълго време не са разработвали своите алгоритми. Всичко върви към това - дотам, че влизаме и без да натискаме нищо, получаваме това, от което се нуждаем (и ставаме напълно глупави, защото способността ни да избираме напълно изчезна).

Маркетинг на влияние

Я: - Здравейте. Казвам се Константин. Бих искал да повдигна въпрос относно маркетинга на влияние. Знаете ли някакви системи, които позволяват на бизнеса да избере подходящ блогър за бизнеса въз основа на някои статистически данни и т.н.? И на какво основание се прави това?

Артър Хачуян: изкуствен интелект в маркетинга

ОХ: – Да, ще започна отдалече и веднага ще кажа, че проблемът с всички тези технологии е, че целият този изкуствен интелект в маркетинга вече е като въжеиграч: отляво има големи компании, които имат много пари, а в във всеки случай всичко ще бъде ефективно за тяхната работа, защото техните рекламни кампании са насочени просто към гледания; от друга страна, има много малки предприятия, за които това няма да работи, защото те имат много данни. Засега приложимостта на тези истории е някъде по средата.

Когато вече има добри бюджети и задачата е тези бюджети да бъдат обработени правилно (и по принцип вече има доста много данни)… Знам няколко услуги, нещо като Getblogger, които изглежда имат алгоритми. Честно казано, не съм изучавал тези алгоритми. Мога да ви кажа какъв подход използваме, за да намерим лидери на мнение, когато трябва да направим подарък на някои майки.

Ние използваме показател, наречен Време за разпространение на съдържанието. Работи по следния начин: взимате човек, чиято аудитория анализирате, и трябва систематично (например веднъж на всеки 5 минути) да събирате информация за всяка публикация, кой я е харесал, коментирал и т.н. По този начин можете да разберете в кой момент всеки човек от аудиторията ви е взаимодействал с вашето съдържание. Повторете тази операция за всеки представител на неговата аудитория и по този начин, използвайки метриката на средното време за разпространение на съдържание, тя може например да бъде оцветена в голяма мрежова графика на тези хора и да използва тази метрика за изграждане на клъстери.

Това работи доста добре, ако искаме например да намерим 15 майки, които поддържат общественото си мнение в някакъв woman.ru. Но това е доста сложна техническа реализация (въпреки че чисто теоретично може да се направи в Python). Изводът е, че проблемът с маркетинга за влияние в големите рекламни агенции е, че те се нуждаят от големи, готини, скъпи блогъри, които не работят за лайна. Сега една автомобилна марка иска да продаде някакъв продукт чрез някакъв лидер на мнение - те трябва да използват автомобилен блогър като последна инстанция, защото аудиторията им или вече е купила кола, или знае точно какъв вид кола иска, просто седи и гледа готини коли. Тук е важно да не пропуснете анализа на аудиторията на самия човек.

Маркетингови ботове

Я: – Кажете доколко ботовете в социалните мрежи влияят върху събирането на информация и нейното качество?

Артър Хачуян: изкуствен интелект в маркетинга

ОХ: – Това е толкова интересно нещо с ботовете. Евтините ботове са доста лесни за идентифициране - те или имат едно и също съдържание, или са приятели помежду си, или са в една и съща мрежа. Има и подходи за справяне със сложни ботове. Или задавате проблема как да свържете човек с неговия фалшификат?

Я: – Колко висококачествена информация ще бъде изходът с целия този боклук?

ОХ: – Тук работи по следния начин: поради факта, че има огромно количество данни (например за някакво маркетингово проучване), цялата тази гавра може просто да бъде изхвърлена. Тоест, по-добре е да изхвърлите малко повече истински хора, отколкото да улавяте ботове, защото е безполезно да показват реклама. Но ако събирате показатели, например взаимодействия с банери или системи за препоръки, такива акаунти могат да бъдат изхвърлени.

Сега в социалните мрежи има около шест процента виртуални герои или просто изоставени страници или интроверти, които алгоритмите „съвпадат“ като ботове. Що се отнася до обвързването на човек с неговия фалшив, тук също всичко е свързано с факта, че човекът рано или късно ще направи грешка, а работата е там, че моделът на поведение е един и същ - и истинският му акаунт, и неговият фалшив. Рано или късно те ще гледат същото съдържание или нещо друго.

Тук всичко се свежда не до процента грешка, а до времето, необходимо за надеждно идентифициране на човек. За някой, който живее със своя Instagram, това време за надеждна идентификация се свежда до пет минути. За някои – с шест до осем месеца.

На кого и как да продаваме данни?

Я: - Здравейте. Интересно ми е как се продават данни между компании? Например, имам приложение, в което можете да разберете (на разработчика) къде ходи човек, в какви магазини ходи и колко пари харчи там. И ми е интересно да знам как, да речем, мога да продам данни за моята аудитория на тези магазини или да поставя данните си в една огромна база данни и да ми плащат за това?

Артър Хачуян: изкуствен интелект в маркетинга

ОХ: – Що се отнася до продажбата на данни директно на някого, вие и всички останали изпреварихте OFD – операторите на фискални данни, които хитро се изградиха между трансфера на чекове и данъчната служба и сега се опитват да продават данни на всички. Наистина, те всъщност сринаха целия пазар на мобилни анализи. Всъщност можете да вградите вашето приложение, например Facebook пиксела, неговата DMP система; след това използвайте тази аудитория, за да продавате. Например пикселът „May Target“. Просто не знам каква публика имате, трябва да разберете. Но във всеки случай можете да се интегрирате или в Yandex, или в My Target, които са най-големите DMP системи.

Това е доста интересна история. Единственият проблем е, че вие ​​ще им дадете целия трафик и те, като борси, ще поемат върху себе си монетизацията на този трафик. Те могат или не могат да ви кажат, че 10 души са използвали вашата аудитория. Следователно или изграждате своя собствена рекламна мрежа, или се предавате на големи DMP.

Кой ще спечели - художникът или техничарят?

Я: – Малко встрани от техническата част въпрос. Беше казано за страховете на търговците от предстоящата масова безработица. Има ли някаква конкурентна борба между креативния маркетинг (тези момчета, които измислиха рекламата на пилета, рекламата на Volkswagen, изглежда) и тези, които участват в Big Data (които казват: сега просто ще съберем всички данни и ще предоставим насочена реклама на всички)? Като човек, който е пряко ангажиран, какво е мнението ви кой ще спечели - художник, техник или ще има някакъв синергичен ефект?

Артър Хачуян: изкуствен интелект в маркетинга

ОХ: – Слушай, добре, те работят заедно. Инженерите не идват с креативност. Тези, които са креативни, не измислят публика. Тук има някаква мултидисциплинарна история. Истинските проблеми сега са за тези, които седят и натискат бутони, за тези, които вършат „маймунската работа“, натискайки едно и също всеки ден - това са хората, които ще изчезнат.

Но тези, които анализират данните, естествено ще останат, но някой трябва да обработи тези данни. Някой ще трябва да измисли тези картини, да ги нарисува. Една машина не може да измисли такава креативност! Това е пълна лудница! Или като например вирусната реклама на Carprice, която между другото работи много добре. Спомнете си, имаше това в YouTube: „Продайте го в Carprice,“ пълна лудост. Разбира се, нито една невронна мрежа няма да генерира такава история.
По принцип съм привърженик на това, че не хората ще останат без работа, а ще имат малко повече свободно време, като това свободно време ще могат да го отделят за самообучение.

Примитивната реклама ще изчезне

Я: - Като цяло рекламата, която се показва, банерите - като цяло, дори и продаващи текстове не са написани там: „Имате нужда от прозорци - вземете го!“, „Имате нужда от нещо друго - вземете го!“, т.е. там изобщо няма креативност.

ОХ: – Такава реклама ще отмре, разбира се, рано или късно. Ще отмре не толкова заради развитието на технологиите, а заради развитието на теб и мен.

По-добре е да смесите уместното с неуместното

Я: - Тук съм! Имам въпрос относно експеримента, за който казахте, че не се е получил при вас (със системата за препоръчване). Според вас проблемът в какво е подписано там ли е, защо е препоръчително или всичко, което потребителят е видял, му се е сторило подходящо? Тъй като прочетох експеримент за майки и все още нямаше толкова много данни и нямаше толкова много данни от интернет, имаше само данни от търговец на хранителни стоки, който предсказваше бременност (че те ще бъдат майки). И когато показаха селекция от продукти за бъдещи майки, майките бяха ужасени, че са разбрали за тях преди всякакви официални неща. И не се получи. И за да решат този проблем, те умишлено смесват съответните продукти с нещо напълно неподходящо.

Артър Хачуян: изкуствен интелект в маркетинга

ОХ: „Ние специално показахме на хората основата, на която са направени препоръките, за да разберем обратната им връзка. Всъщност тук се роди идеята, че хората нямат нужда да бъдат казвани, че това са някакви супер подходящи продукти за него.

Да, между другото, има подход да се смесват с неподходящи. Но има и обратното: понякога хората идват и взаимодействат с този неуместен продукт - възникват случайни отклонения, моделите се развалят и нещата стават още по-сложни. Но това действително съществува. Освен това, много компании умишлено, ако знаят, че някой обработва техните данни (някой може да открадне такъв резултат от тях), те понякога ги смесват, за да могат по-късно да докажат, че не сте взели данните от тяхната система за препоръки, а от така нареченият Yandex.Market.

Рекламни блокери и сигурност на браузъра

Я: - Здравейте. Споменахте Ghostery и Adblock. Можете ли да ни кажете колко ефективни са такива тракери като цяло (може би въз основа на статистика)? И имахте ли поръчки от компании: те казват, уверете се, че нашата реклама не може да бъде затворена от Adblock.

ОХ: – Ние не контактуваме директно с рекламни платформи – именно за да не поискат рекламата им да бъде видима за всички. Аз лично използвам Ghostery – мисля, че е много готино разширение. Сега всички браузъри се борят за поверителността: Mozilla пусна куп всякакви актуализации, Google Chrome вече е супер защитен. Всички блокират всичко, което могат. „Safari“ дори е изключил „Жироскоп“ по подразбиране.
И тази тенденция, разбира се, е добра (не за тези, които събират данни, въпреки че те също се измъкнаха от нея), защото хората първо блокираха бисквитките. Всички, които притежават рекламни мрежи, си спомнят такава прекрасна технология като пръстови отпечатъци на браузъра - това са алгоритми, които получават 60 различни параметъра (разделителна способност на екрана, версия, инсталирани шрифтове) и въз основа на тях изчисляват уникален „ID“. Нека да преминем към това. И браузърите започнаха да се борят с това. Като цяло това ще бъде безкрайна битка на титаните.

Най-новият разработчик Mozilla е доста сигурен. На практика не запазва бисквитки и задава кратък живот. Особено ако включите „Инкогнито“, никой изобщо няма да ви намери. Въпросът е, че ще бъде неудобно да въвеждате пароли във всички услуги.

Къде работи и не работи психотипизацията и физиономията?

Я: – Артур, много ти благодаря за лекцията. С удоволствие следя лекциите ви и в YouTube. Споменахте, че търговците все по-често прибягват до използването на психотипизация и физиономия. Въпросът ми е: в какви категории марки работи това? Вярвам, че това е подходящо само за бързооборотни стоки. Например изборът на кола е...

ОХ: – Мога да изтегля къде точно работи. Това работи във всякакви истории като „Амедиатека“, сериали, филми и т.н. Това работи добре в банките и банковите продукти, ако не е премиум сегментът, а всякакви студентски карти, планове на вноски - такива неща. Това наистина работи много добре в бързооборотните стоки и всякакви видове iPhone, зарядни устройства, всички тези глупости. Това работи добре в продуктите „мама и поп“. Въпреки че знам, че в риболова (има такава тема)... Няколко пъти е имало случаи с риболовци - никога не могат да бъдат надеждно сегментирани. Не знам защо. Някаква статистическа грешка.

Това не работи добре с шофьори, с бижута или с някои предмети от бита. Всъщност не работи добре с неща, за които хората никога не биха писали в социалните медии - можете да го проверите по този начин. Обикновено, с покупката на пералня: ето как да разберете кой има пералня и кой не? Изглежда, че всеки го има. Можете да използвате OFD данни - вижте кой какво е купил с помощта на касови бележки и съпоставете тези хора с помощта на касови бележки. Но всъщност има неща, за които никога не бихте говорили, например в Instagram - трудно е да се работи с такива неща.

Машините разпознават триковете като статистически пълнеж.

Я: – Имам въпрос относно насочването. Възможно ли е (или внезапно съществуват) условен случаен герой, който си противоречи във всичко: първо търси в Google „най-добрите фитнес зали“, а след това търси в Google „10 начина да не правиш нищо“? И така е във всичко. Може ли насочването да следи нещо, което си противоречи?

ОХ: – Единственият въпрос тук е следният: ако сте използвали Google от 2 години, казали сте му всичко, което можете за себе си, и сега инсталирате плъгин за себе си, който ще пише подобни произволни заявки, тогава, разбира се, от статистиката ще бъдете в състояние да разберете – това, което правите сега, е статистическа разлика и всичко това е въпрос на отсяване. Ако искате, регистрирайте нов акаунт, но обемът на рекламата няма да се промени. Тя просто ще стане странна. Въпреки че тя все още е странна.

Малко реклами 🙂

Благодарим ви, че останахте с нас. Харесвате ли нашите статии? Искате ли да видите още интересно съдържание? Подкрепете ни, като направите поръчка или препоръчате на приятели, облачен VPS за разработчици от $4.99, уникален аналог на сървъри от начално ниво, който беше изобретен от нас за вас: Цялата истина за VPS (KVM) E5-2697 v3 (6 ядра) 10GB DDR4 480GB SSD 1Gbps от $19 или как да споделите сървър? (предлага се с RAID1 и RAID10, до 24 ядра и до 40GB DDR4).

Dell R730xd 2 пъти по-евтин в центъра за данни Equinix Tier IV в Амстердам? Само тук 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV от $199 в Холандия! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - от $99! Прочети за Как да изградим инфраструктура Corp. клас с използване на сървъри Dell R730xd E5-2650 v4 на стойност 9000 евро за стотинка?

Източник: www.habr.com

Добавяне на нов коментар