Arthur Khachuyan:行銷中的人工智慧

Arthur Khachuyan 是俄羅斯著名的大數據處理專家,Social Data Hub 公司(現為 Tazeros Global)的創辦人。 國立研究大學高等經濟學院合作夥伴。 與國立研究大學高等經濟學院共同起草並提出聯邦委員會大數據法案。他在巴黎居禮研究所、聖彼得堡國立大學、俄羅斯聯邦政府下屬聯邦大學發表演講,紅蘋果、國際開放資料日、RIW 2016、AlfaFuturePeople 。

該講座是在2019年莫斯科露天音樂節「極客野餐」上錄製的。

Arthur Khachuyan:行銷中的人工智慧

亞瑟‧卡楚揚(Arthur Khachuyan,以下簡稱「AH」): – 如果從眾多的行業——從醫藥、從建築、從某事、某事中選擇一個最常使用大數據、機器學習、深度學習技術的行業,那麼這可能就是行銷。 因為在過去三年左右的時間裡,我們周圍的某種廣告傳播中的一切現在都與數據分析和所謂的人工智慧緊密相關。 所以,今天我就跟大家講講這個遙遠的歷史…

如果你想像一下人工智慧及其外觀,它可能就是這樣的。 這張奇怪的圖是我一年前寫的一個神經網絡,用來尋找我的狗所做的事情的依賴性——她需要變大、變小多少次,以及它通常如何取決於她吃了多少或不? 。 這是一個關於如何想像人工智慧的笑話。

Arthur Khachuyan:行銷中的人工智慧

但是,我們仍然要考慮一下這一切在廣告傳播中是如何運作的。 廣告和行銷領域的現代演算法可以透過三種方式與我們互動。 很明顯,第一個故事的目的是獲取和提取關於你和我的額外知識,然後將其用於一些好的或不太好的目的; 對每個特定的人採取個人化的方法; 當然,在此之後,創造一定的需求,以執行主要目標行動並進行一定的銷售。

他們試圖利用科技來解決有效溝通的問題

如果我叫你想想 Pornhub 和 M. 影片”,你在想什麼?

觀眾評價(以下簡稱C): - 電視、觀眾。

哦: – 我的概念是,這是人們為了某種類型的服務而來的兩個地方,或者我們稱之為某種類型的商品。 而這個受眾的不同之處在於,他們不想告訴賣家任何事情。 她想進來並以某種明確或隱含的形式獲得她感興趣的東西。 自然就沒有人來找M了。 影片」不想與任何賣家溝通,不想理解,不想回答他們的任何問題。

因此,第一個故事就由此而來。

當獲得額外知識的技術出現時,以便以某種方式避免與人溝通。 我們都喜歡當我們打電話給銀行,銀行告訴我們:「你好。 Alexey,你是我們的 VIP 客戶。 現在有超級經理來跟你說話。” 你來到這家銀行,確實有一位獨特的經理可以和你交談。 不幸的是,還是幸運的是,目前還沒有一家公司能夠弄清楚如何為一千名客戶聘請一千名私人經理人。 由於這些人現在大多數都在線,所以任務是在他接觸某些廣告資源之前了解他是什麼樣的人以及如何與他正確溝通。 因此,事實上,已經出現了試圖解決這個問題的技術。

資料提取是新石油

假設您是個花攤的老闆。 三個人來看你。 第一個站了很長時間,猶豫了一下,試著和你說話,拿了某種花束——你去把它包起來,出去做點什麼; 他帶著這束花從攤位跑了——你已經損失了三千盧布。 為什麼會發生這樣的事? 你對這個人一無所知:你不知道他在內政部被捕的歷史,你不知道他是一個盜竊狂並且在精神病藥房登記。 為什麼? 因為你是第一次看到它,而且你不是行為分析師。

還有人來了……維塔利。 維塔利也花了很長時間才弄清楚,他說,“好吧,我需要這個和那個。” 然後你告訴他:“給媽媽送花,對嗎?” 然後你賣給他一束花。

這裡的概念是找到足夠的數據來了解人們的實際需求。 大家立刻就想到了某種廣告網路之類的…

大家可能不只一次聽過「數據就是新石油」這句愚蠢的話吧? 想必大家都聽過。 事實上,人們很久以前就學會了收集數據,但從這些數據中提取數據是行銷中的人工智慧,或者某種統計演算法現在正在努力解決的任務。 為什麼? 因為如果你和一個人交談,他可以給你一個正確、錯誤或某種帶有色彩的答案。 我給我的學生講的笑話是調查與統計有何不同。我將這作為一個軼事告訴你們:

這意味著他們決定在兩個村莊進行一項關於男性平均壽命的研究。 這意味著在第一個村莊 Villaribo,平均長度為 15 厘米,在 Villabaggio 村莊為 25 厘米。你知道為什麼嗎? 因為測量是在第一個村進行的,調查是在第二個村莊進行的。

色情產業是推薦系統的旗艦

這就是為什麼現代的方法是無一例外地分析所有人,即使他們略低於100%,但這些人是你不需要問的人,你不需要看他們。 分析現在所謂的數位足跡就足以了解這個人需要什麼,如何正確地與他交談,如何正確地在他周圍創造需求。 一方面,這是一台無意識的機器(但你我都清楚這一點); 我們不想和M的人交流。 影片”,更重要的是,當我們訪問 Pornhub 等資源時,我們希望得到我們真正需要的東西。

為什麼我總是談論 Pornhub? 因為成人產業是最早進行此類技術的分析、此類技術的實施、數據分析的。 如果你採用該領域最受歡迎的三個函式庫(例如,用於處理 CSV 檔案的 TensorFlow 或 Pandas for Python,等等),如果你在 Github 上打開它,用簡短的 Google 搜尋所有這些名稱,你會發現有幾個人曾經或現在在Pornhub 公司工作,並且是第一個在那裡實施推薦系統的人。 總的來說,這個故事是非常先進的,並且展示了這個觀眾有多少,這家公司向前邁進了多少。

Arthur Khachuyan:行銷中的人工智慧

三個級別的識別

一個人周圍有大量可以識別的數據。 我通常將其正式分為三個層次,並且越來越深入。 當然,公司有自己的數據。

比方說,如果我們正在談論建立一個推薦系統,那麼第一層就是位於商店本身的資料(購買歷史記錄、各種交易、人如何與介面互動)。

接下來還有一個等級(相對最大)——這就是所謂的開源。 不要以為我鼓勵你抓取社交網絡,但事實上,開源中提供的內容打開了大量數據,你可以透過這些數據了解一個人。

而第三大的部分就是這個人本身的環境。 是的,有一種觀點認為,如果一個人不在社交網路上,那麼那裡就沒有關於他的數據(您可能已經知道這不是真的),但最重要的是一個人的個人資料上的數據(或在某些應用中)僅佔可獲得的知識的40%。 其餘的資訊是從他的環境中獲得的。 「告訴我你的朋友是誰,我就會告訴你你是誰」這句話在 XNUMX 世紀有了新的意義,因為可以獲得大量有關該人的數據。

如果我們更接近廣告傳播,那麼接收廣告傳播不是來自廣告,而是來自一些朋友、熟人或以某種方式經過驗證的人,這是許多行銷人員使用的一個非常酷的功能。 當某個應用程式突然向您提供免費促銷代碼時,您會發布有關它的帖子,從而吸引新的受眾。 事實上,這個有條件「Yandex.Taxi」的促銷代碼並不是隨機選擇的,但為此,我們分析了大量數據,了解您吸引新受眾並以某種方式與他們互動的潛力。

Arthur Khachuyan:行銷中的人工智慧

他們甚至分析電視劇人物的行為

我給你看三張圖片,你告訴我它們之間有什麼不同。

這個:

Arthur Khachuyan:行銷中的人工智慧

這:

Arthur Khachuyan:行銷中的人工智慧

和這個:

Arthur Khachuyan:行銷中的人工智慧

他們之間有什麼區別? 這裡一切都很簡單。 與量子力學一樣,在這種情況下,這種創造力是由觀察者形成的。 也就是說,同一品牌在同一時間進行的同一廣告活動的差異僅在於誰觀看了該創意。 就我個人而言,當我去阿梅迪亞特卡時,他們仍然展示卓戈卡奧。 我不知道 Amediateka 對我的偏好有何看法,但由於某種原因,這種情況發生了。

現在所謂的個人化溝通是最受歡迎的吸引受眾並與之適當互動的故事。 如果在第一階段我們使用我們自己的品牌數據、開源數據以及例如來自這個人的環境的數據來識別人,那麼在分析他之後,我們可以了解他是誰,如何正確地與他交談,最重要的是,他用什麼語言跟他說話。

科技已經發展到可以對人們觀看的電視劇中的角色進行分析的程度。 就是你喜歡電視劇,他們看,他們看你在裡面和誰互動,從而了解你適合和什麼樣的人互動。 這聽起來完全是無稽之談,但只是為了好玩,在其中一種資源上嘗試一下 - 不同的人會看到不同的創意(以便正確地與其互動)。

沒有任何一個現代媒體或任何視訊資源只是向您展示一些新聞。 去媒體——加載大量演算法來識別您的身份,了解您之前的所有活動,訴諸數學模型,然後向您展示一些東西。 在這種情況下,就有了這樣一個離奇的故事。

需求如何確定? 心理測量學。 相貌

有很多(真實的)方法可以確定一個人的實際需求以及如何與他們正確溝通。 方法有很多種,每件事的解決方法都不同,不可能說哪個好哪個壞。 主要的人似乎什麼都知道。

Arthur Khachuyan:行銷中的人工智慧

心理測量學。 在劍橋分析公司的報導之後,在我看來,事情發生了某種令人震驚的轉折,因為現在每隔一個政治公司就會過來說:「哦,你能讓我變得像川普嗎? 我也想贏,等等。” 事實上,這對我們的現實,例如政治選舉來說,當然是無稽之談。 但為了確定心理類型,使用了三種模型:

  • 第一個是基於你消費的內容──你寫的文字、你喜歡的一些資訊、影片等;
  • 第二個與你如何與網頁介面互動、你如何打字、你按下哪些按鈕有關——事實上,有一些公司可以根據他們的鍵盤筆跡,非常可靠地確定現在所謂的心理類型。
  • 我不是一個心理學家,我不太明白它是如何運作的,但從廣告傳播的角度來看,分為這些部分的受眾效果很好,因為需要向某人展示帶有藍色的紅色屏幕女人,需要向某人展示一個帶有某種抽象的黑色螢幕-藍色背景,而且它的效果非常酷。 在某些低水平上——以至於人們甚至不會考慮它。 現在廣告市場的主要問題是什麼? 每個人都是情報人員,每個人都在隱藏,每個人都安裝了數百萬個瀏覽器權限,以免以任何方式被識別- 你可能有“Adblocks”、“Gostrey”和各種阻止跟踪的應用程式. 正因為如此,要了解一個人的任何事情都是非常困難的。 技術已經進步——你不僅需要知道這個人已經第 125 次回到你的網站,而且他也是一個如此奇怪的人。

面相學是一門非常有爭議的科學。 它甚至不被認為是科學。 這是一群曾經為某些內務部編寫測謊儀程式的人,現在從事所謂的創造力擬人化。 這裡的方法非常簡單:你的幾張公開照片取自一些社交網絡,並根據它們建立三維幾何。 如果你是律師,你現在會說這是一個人和個人資料; 但我告訴你,這是位於太空的三十萬個點,這不是一個人,也不是個人資料。 這是每個人在 Roskomnadzor 來找他們時通常都會說的話。

但說實話,如果你的名字和姓氏沒有在那裡簽名,那麼你的臉就不是你的個人資料。 關鍵是,這些人標記了各種面部特徵,這些特徵會影響一個人如何做出決定以及如何與他正確互動。 在某些領域,在某些廣告領域,這種方法效果不佳; 它在哪些細分領域表現得很好。 最後,事實證明,當您訪問某些資源時,您看到的不僅僅是一個向所有人展示的橫幅,而且,例如…現在為不同的受眾提供16 或20 個選項是很正常的- 而且它有效很酷。 是的,從消費者的角度來看,這更令人悲傷,因為人們開始越來越被操縱。 但無論如何,從商業角度來看,它的效果非常好。

機器學習的黑盒子

這就帶來了此類技術的以下問題:畢竟,對於大多數開發人員來說,現在所謂的深度學習是一個「黑盒子」。 如果你曾經沉浸在這個故事中並與開發人員交談過,他們總是會說:「哦,聽著,好吧,我們在那裡編寫了一些難以理解的程式碼,而且我們不知道它是如何工作的。” 也許有人遇到過這種情況。

這實際上遠非事實。 現在所謂的機器學習遠非「黑盒子」。 描述輸入和輸出資料的方法有很多種,最終公司可以根據什麼跡象徹底了解機器決定向你展示這個或其他色情影片。 問題是,沒有一家公司披露過這一點,因為:首先,這是商業機密; 其次,會有大量你不知道的數據。

例如,在此之前,在關於道德的討論中,我們討論了社交網路如何分析個人訊息,以便在某種廣告故事中標記人物。 如果您為某人寫了一些東西,基於此您會收到一個特定的標籤,實際上是某種廣告通訊。 你永遠無法證明這一點,而且證明它可能沒有任何意義。 然而,如果類似的模式被發現,它們就會存在。 事實證明,建立此類推薦系統的市場假裝不知道為什麼會發生這種情況。

人們不想知道人們對他們的了解

第二個故事是,客戶永遠不想知道為什麼他會收到這個特定的廣告、這個特定的產品。 我會告訴你這個故事。 我第一次出於研究目的而商業實施基於類似演算法的推薦系統是在 2015 年,在一個非常大的性用品商店網路中(是的,這也不是一個特別令人不快的故事)。

Arthur Khachuyan:行銷中的人工智慧

為客戶提供以下服務:他們進來,使用社交網絡登錄,大約 5 秒後,他們會收到一個完全個性化的商店,也就是說,所有產品都發生了變化 - 它們屬於某個類別,等等。 你知道這家店的轉換率提高了多少嗎? 無論如何都不是! 人們進來後立即逃離。 他們進來後意識到,他們所得到的正是他們所想的......

這個測試的​​問題在於,在每件產品下都寫著為什麼向您提供該特定產品(“因為您是隱藏群體的成員”強大的女人正在尋找一個受氣包的男人”)。 因此,現代推薦系統從不顯示做出「預測」所依據的數據。

一個非常受歡迎的故事是媒體,因為它們都使用類似的推薦系統。 以前,演算法非常簡單:查看“政治”類別 - 它們會向您顯示“政治”類別中的新聞。 現在一切都變得如此複雜,他們會分析你停止滑鼠的地方、你集中註意力的單字、你複製的內容、你通常如何與這個頁面互動。 然後他分析了消息本身的詞彙:是的,你不僅僅是在閱讀有關普丁的新聞,而是以某種方式,帶有某種情感色彩。 而當一個人收到一些消息的時候,他根本不會去想自己是怎麼來到這裡的。 儘管如此,他隨後仍與該內容互動。

當然,這一切都是為了讓這個可憐的、不幸的小男人不被周圍的大量資訊弄得發瘋。 這裡必須要說的是,如果能使用這樣的系統來個性化你周圍的創意並收集一些信息,那就太好了,但不幸的是,目前還沒有這樣的服務。

人工智慧捕捉空中客戶並創造需求

這裡出現了一個非常有趣的哲學問題,從創建推薦系統到創造需求。 很少有人思考這個問題,但當你試圖問所謂的 Instagram 時,「你為什麼要收集數據? 為什麼不向我展示絕對隨機的廣告呢?” - Instagram 會告訴你:“朋友,這一切都是為了向你準確展示你感興趣的內容。” 就像,我們想準確地了解您,以便我們可以準確地向您展示您正在尋找的東西。

Arthur Khachuyan:行銷中的人工智慧

但技術早已跨越了這個可怕的門檻,類似的技術不再預測你需要什麼。 他們(注意!)創造需求。 這可能是此類通訊中圍繞人工智慧最可怕的事情。 可怕的是,在過去的 3-5 年裡,它幾乎無處不在——從 Google 搜尋結果到 Yandex 搜尋結果,再到某些系統……好吧,我不會說 Yandex 的任何壞話; 好的。

重點是什麼? 這類廣告傳播已經很久沒有擺脫那種寫下「我想買一個兒童座椅」並看到數十億出版物的策略了。 他們接著說:當這位女士發布了一張幾乎看不見肚子的照片時,她的丈夫立即開始收到訊息:「男人,馬上就要生產了。 買個兒童座椅吧。”

在這裡,你可能會合理地問,為什麼隨著科技的巨大進步,我們仍然在社群網路上看到如此糟糕的廣告? 問題是,在這個市場上,一切仍然是由金錢決定的,所以某個好時機,一些像可口可樂這樣的廣告商可能會過來說:「這裡有20 萬給你——把我的爛橫幅展示給整個互聯網。” 他們真的會這麼做。

但是,如果你做了某種乾淨的帳戶並測試這些演算法猜測你的準確程度:他們首先嘗試猜測你,然後他們開始提前對你做一些事情。 人腦的工作方式是,當接收到對其來說可靠的資訊時,它甚至不會處理接收到該資訊的原因。 確定你是否在夢中的首要規則是了解你是如何來到這裡的。 一個人永遠不會記得他進入某個房間的那一刻。 這裡也是一樣。

Google可能開始塑造你的世界觀

這類研究是由幾家從事i-tracking的外國公司進行的。 他們在特殊的電腦上安裝了設備,記錄測試對象眼睛的注視位置。 我招募了五到七千名志願者,他們只是簡單地滾動資訊流,與社交網路和廣告進行互動,然後他們記錄了這些人將目光停留在橫幅和創意的哪些部分的資訊。

事實證明,當人們收到如此超個性化的創意時,他們甚至不會考慮它 - 他們立即繼續前進,開始與之互動。 從商業角度來看,這很好,但從我們作為用戶的角度來看,這並不是很酷,因為——他們害怕什麼? – 在一個好的時刻,有條件的「Google」可能會開始(或者,當然,它可能不會開始)形成自己的世界觀。 例如,明天他就可以開始向人們展示地球是平的消息。

開玩笑,但他們被抓了很多次,以至於在選舉期間他們開始向某些人提供某些資訊。 我們都習慣了搜尋引擎誠實地獲取一切的事實。 但是,正如我常說的,如果您真的想知道世界是如何運作的,請編寫自己的搜尋引擎,無需過濾器,無需關注版權,無需在搜尋結果中對您的一些朋友進行排名。 網路上真實數據的顯示通常與Google、Yandex、Bing等顯示的不同。 有些材料被隱藏是因為朋友、同事、敵人或其他人(或與你睡過的前情人)——這並不重要。

川普如何獲勝

美國上次選舉時,進行了非常簡單的研究。 他們在不同的地方、不同的 IP 位址、不同的城市接受了相同的請求,不同的人在 Google 上搜尋了相同的內容。 按照慣例,請求的風格是:誰會贏得選舉? 令人驚訝的是,結果的建構方式是,在那些試圖投票給錯誤候選人的人數最多的州,他們收到了有關Google宣傳的候選人的一些好消息。 哪一個? 嗯,很清楚是哪一位──成為總統的那一位。 這是一個絕對無法證實的故事,所有這些研究都是徒勞無功的。 谷歌可以說:“夥計們,這一切都是為了我們向你們展示最相關的內容。”

從現在開始,你應該知道,所謂的最大相關性,絕對不是這樣的。 該公司稱相關的東西出於某種好或壞的原因需要賣給你。

現在沒錢的人已經為以後的購買做好了準備

這裡還有一個有趣的點我要告訴你。 現在社交網路和應用程式中的大量活躍受眾是年輕人。 我們稱之為-無力償債的青少年:8-9歲的孩子,他們玩低能遊戲,這些孩子12歲、13歲、14歲,剛剛在社群網路上註冊。 為什麼大公司會花費大量的預算和資源來為非付費受眾創建從未貨幣化的應用程式? 當這些受眾變得有償付能力時,就會有足夠的數據來很好地預測其行為。

Arthur Khachuyan:行銷中的人工智慧

現在問問目標學家,最難對付的受眾是什麼? 他們會說:利潤很高。 因為,例如,透過社群網路出售一套價值 150 億盧布的公寓幾乎是不可能的。 有一些孤立的情況,當你為一萬人做某種廣告時,其中一個人買了這套公寓——客戶是成功的……但從統計的角度來看,萬分之一是完全垃圾。 那麼,為什麼難以辨識高收入受眾呢? 因為現在成為高利潤受眾的人們是在網路還很小的時​​候出生的,當時還沒有人認識阿爾喬米·列別傑夫,也沒有關於他們的資訊。 無法預測他們的行為模式,無法了解他們的意見領袖是誰以及他們從哪些來源接收內容。

因此,當你們在 25 年後都成為億萬富翁時,那些要向你們出售東西的公司將擁有大量數據。 這就是為什麼我們現在在歐洲制定了一項出色的 GDPR,以防止收集未成年人的數據。

當然,這在實踐中根本行不通,因為所有的孩子仍然在他們父母的帳戶上玩——這就是資訊收集的方式。 下次您給孩子使用平板電腦時,請考慮這一點。

絕對不是某個可怕的反烏托邦未來,每個人都會在與機器的戰爭中死去——現在這絕對是真實的故事。 有大量公司正在根據人們玩遊戲的方式創建演算法,並對他們進行心理分析。 一個非常有趣的行業。 基於這一切,人們被細分,以便以某種方式與他們溝通。

Arthur Khachuyan:行銷中的人工智慧

對這些人的行為的預測將在 10-15 年內實現——正是在他們成為有償付能力的受眾的那一刻。 最重要的是,這些人已經提前獲得了處理他們個人資料的許可,將其轉移給第三方,這一切都是幸福的,等等。

誰會失去工作?

我的最後一個故事是,每個人總是問50年後會發生什麼事:我們都會死,行銷人員會失業......這裡有行銷人員擔心失業,對吧? 一般來說,無需擔心,因為任何高素質的人都不會失去工作。

Arthur Khachuyan:行銷中的人工智慧

無論創建什麼演算法,無論機器與我們這裡的東西有多接近(指著他的頭),如果它發展得足夠快,這樣的人永遠不會閒著,因為必須有人創造這些創造性的東西。 是的,有各種各樣的“甘斯”,他們畫看起來像人的圖畫並創作音樂,但這個地區的人仍然不太可能失業。

Arthur Khachuyan:行銷中的人工智慧

我有故事的所有內容,所以如果您有更多問題,可以提問。 謝謝。

Arthur Khachuyan:行銷中的人工智慧

領導: – 朋友們,我們現在進入「問答」部分。 你舉起手——我向你走來。

Arthur Khachuyan:行銷中的人工智慧

觀眾提問(XNUMX): – 關於「黑盒子」的問題。 他們表示,可以具體理解為什麼某個用戶會得到這樣或那樣的結果。 這些是某種演算法嗎,還是每次都需要針對每個模型進行臨時分析(作者註:「特別是為此」-拉丁文措詞單位)? 或者是否有現成的某種神經網絡,粗略地說,可以具有商業意義?

哦: – 在這裡你需要了解以下幾點:機器學習中有大量的任務。 比如有一個任務——回歸。 對於回歸,根本不需要神經網路。 一切都很簡單:您有幾個指標,您需要計算以下內容。 有些任務需要藉助深度學習之類的東西。 事實上,在深度學習中,很難可靠地理解分配給哪些神經元的權重,但從法律上講,您所需要的只是了解輸入端有哪些資料以及輸出端如何發揮作用。 這在法律上足以為這樣的決定申請專利,並且足以理解這個故事是在什麼基礎上製作的。

這並不是說你因為兩個月前在 Instagram 上拍了一張紅頭髮的照片而訪問了該網站,並看到了某種橫幅。 如果開發人員沒有在這個模型中包含這些資料的收集和頭髮顏色的標記,那麼它就不會憑空出現。

如何銷售機器學習系統的成果?

Z: – 這只是一個「什麼」的問題:到底要如何解釋,如何向不懂機器學習的人推銷。 我想說:我的模型顯然是從頭髮顏色導致……嗯,頭髮顏色改變……這可能嗎?

Arthur Khachuyan:行銷中的人工智慧

哦: - 也許是吧。 但從銷售的角度來看,唯一可行的方案是:你有一個廣告活動,我們用機器生成的受眾取代受眾 - 然後你就可以看到結果。 不幸的是,這是可靠地讓客戶相信這樣的故事有效的唯一方法,因為市場上有許多解決方案曾經實施過但不起作用。

關於創建虛擬人格

Z: - 你好。 感謝您的講座。 問題是:一個人因為某些原因不想跟隨機器學習的引導,有什麼機會透過與介面或某些人的互動為自己創造一個與自己的個性截然不同的虛擬個性?其他原因?

Arthur Khachuyan:行銷中的人工智慧

哦: – 有很多不同的外掛程式專門處理隨機行為。 有一個很酷的東西 - Ghostery,在我看來,它幾乎完全將你隱藏在一堆不同的追蹤器中,而這些追蹤器無法記錄這些資訊。 但事實上,現在你所需要的只是社群網路上的一個封閉的個人資料,這樣任何人、任何邪惡的爬蟲都可以在那裡收集任何東西。 安裝某種擴充功能或自己編寫一些東西可能會更好。

你看,這裡的概念是,從法律上來說,例如個人資料是指可以辨識你身分的數據,法律舉例你的居住地址、年齡等等。 如今有無數的資料可以用來辨識你的身分:相同的鍵盤筆跡、相同的按鍵、瀏覽器的數位簽章…一個人遲早會犯錯。 他可以在“咖啡館”的某個地方使用“Thor”,但最終,在一個好的時刻,要么 VPN 忘記打開,要么發生其他原因,在那一刻他就可以被識別出來。 所以最簡單的方法是建立一個私人帳戶並安裝一些擴充功能。

市場正在走向只需按一個按鈕即可獲得結果的地步。

Z: - 謝謝你的故事。 一如既往,總是非常有趣(我在關注你)。 問題是:在創造對使用者有利的系統(推薦系統)方面有何進展? 您說您曾經在開發一個推薦系統,用於尋找性伴侶、生活中的朋友(或者一個人可能喜歡的音樂)……這一切有多麼有前途,您如何看待它的發展創建人們需要的系統的觀點是什麼?

哦: – 總的來說,市場正在發展到人們需要按下一個按鈕並立即獲得他們需要的東西的地步。 就我創建約會應用程式的經驗而言(順便說一下,我們將在年底重新推出它),除了65%是已婚男性之外,最困難的推薦問題是向一個人提供多個模型在應用程序的開頭- 「友誼」、「性」、「性友誼」和「商業」。 人們沒有選擇他們需要的東西。 男人來了並選擇了“愛”,但實際上他們向所有人扔了裸體,等等。

問題是要找出一個不適合這些模型之一的人,並以某種方式順利地把他帶向另一個方向。 由於資料量很小,很難確定這是否是預測演算法的錯誤,或者一個人是否不屬於他的類別。 音樂也是如此:現在很少有真正有價值的演算法能夠很好地「facast」音樂。 也許是「Yandex.Music」。 有些人認為 Yandex.Music 演算法很糟糕。 比如說,我喜歡她。 例如我個人不太喜歡YouTube的音樂演算法等等。

當然,有一些微妙之處 - 一切都與許可證相關......但實際上,對此類系統的需求相當高。 曾經,Retail Rocket公司因參與推薦系統的實施而聞名,但現在不知​​何故進展不佳——顯然是因為他們很長一段時間沒有開發自己的演算法。 一切都朝著這個方向發展——以至於我們進去,不按任何東西,就得到我們需要的東西(並且變得完全愚蠢,因為我們選擇的能力已經完全消失了)。

影響力行銷

Z: - 你好。 我的名字是康斯坦丁。 我想提出一個關於影響力行銷的問題。 您知道有哪些系統可以讓企業根據一些統計數據等為企業選擇合適的部落客嗎? 這樣做的理由是什麼?

Arthur Khachuyan:行銷中的人工智慧

哦: – 是的,我會從遠處開始,立即說所有這些技術的問題在於,行銷中的所有人工智慧現在就像走鋼索的人:左邊是擁有很多錢的大公司,而在無論如何,一切都會對他們的工作有效,因為他們的廣告活動只是針對觀點; 另一方面,對於許多小型企業來說這不起作用,因為他們擁有大量數據。 到目前為止,這些故事的適用性處於中間位置。

當已經有了良好的預算,並且任務是正確處理這些預算時(原則上,已經有相當多的數據)……我知道一些服務,比如 Getblogger,它們似乎有演算法。 說實話,這些演算法我沒有研究過。 我可以告訴你,當我們需要送禮物給一些母親時,我們用什麼方法來尋找意見領袖。

我們使用稱為內容分發時間的指標。 它的工作原理是這樣的:你要分析一個人的受眾,你需要係統地(例如,每 5 分鐘一次)收集每個帖子的信息,誰喜歡它,評論過它,等等。 這樣,您就可以了解受眾中的每個人在什麼時間點與您的內容互動。 對其受眾的每個代表重複此操作,因此,使用內容傳播的平均時間的測量,可以在這些人的大型網絡圖中進行著色,並使用該度量來構建集群。

例如,如果我們想要找到 15 位在某些 Woman.ru 上保持公眾觀點的母親,這種方法就非常有效。 但這是一個相當複雜的技術實現(儘管純粹理論上可以用Python完成)。 最重要的是,大型廣告公司影響力行銷的問題在於,他們需要大的、酷的、昂貴的部落客,但他們不為狗屎工作。 現在,一個汽車品牌想要透過某個意見領袖來銷售某些產品- 他們需要使用汽車部落客作為最後的手段,因為他們的受眾要么已經購買了汽車,要么確切地知道他們想要什麼樣的汽車,只需坐下來看著很酷的汽車。 在這裡,重要的是不要錯過對人本身的受眾的分析。

行銷機器人

Z: – 告訴我,社群網路上的機器人對資訊收集及其品質有多大影響?

Arthur Khachuyan:行銷中的人工智慧

哦: – 對機器人來說這是一件非常有趣的事。 廉價的機器人很容易識別 - 它們要么具有相同的內容,要么彼此是朋友,要么位於同一網路中。 還有一些方法可以處理複雜的機器人。 或者你問的問題是如何將一個人與他的假人連結起來?

Z: – 這麼多垃圾資訊能輸出多少高品質的資訊?

哦: – 這裡的工作原理是這樣的:由於存在大量數據(例如,用於某種營銷研究),所有這些無賴都可以簡單地扔掉。 也就是說,丟掉多一點的真人比捕獲機器人好,因為他們展示任何廣告都是沒有用的。 但是,如果您收集指標,例如與橫幅或推薦系統的交互,則此類帳戶可能會被丟棄。

現在在社交網路上,大約有百分之六的虛擬角色或只是廢棄的頁面或內向的人,演算法將其「配對」為機器人。 至於將一個人與他的假帳戶聯繫起來,在這裡,一切都與這個人遲早會犯錯誤的事實有關,而且行為模型是相同的 - 無論是他的真實帳戶還是他的假帳戶。 他們遲早會觀看相同的內容或其他內容。

在這裡,一切都不是取決於錯誤的百分比,而是取決於可靠地識別一個人所需的時間。 對於那些和 Instagram 生活在一起的人來說,可靠的識別時間只需五分鐘。 對某些人來說——六到八個月。

向誰以及如何出售資料?

Z: - 你好。 我有興趣知道公司之間如何出售數據? 例如,我有一個應用程序,您可以(向開發人員)找出一個人去了哪裡、他去了哪些商店以及他在那裡花了多少錢。 我很想知道如何將我的受眾數據出售給這些商店或將我的數據放入巨大的資料庫並獲得報酬?

Arthur Khachuyan:行銷中的人工智慧

哦: – 至於直接向某人出售數據,你和其他人都領先於 OFD——財政數據運營商,他們狡猾地將自己建立在支票轉移和稅務服務之間,現在正試圖向所有人出售數據。 事實上,他們實際上摧毀了整個行動分析市場。 事實上,你可以嵌入你的應用程序,例如Facebook Pixel,它的DMP系統; 然後利用這些受眾進行銷售。 例如,“五月目標”像素。 我只是不知道你有什麼樣的觀眾,你需要了解。 但無論如何,您都可以整合到 Yandex 或 My Target,它們是最大的 DMP 系統。

這是一個相當有趣的故事。 唯一的問題是,你將所有流量都給了他們,而他們作為交易所,將承擔這些流量的貨幣化。 他們可能會也可能不會告訴您有 10 個人使用過您的受眾。 因此,要麼建立自己的廣告網絡,要麼屈服於大型 DMP。

誰會獲勝──藝術家還是技術人員?

Z: – 一個離技術部分有點遠的問題。 據說這是行銷人員對即將到來的大規模失業的擔憂。 創意行銷(這些人似乎想出了雞肉廣告、大眾汽車廣告)和那些參與大數據的人(他們說:現在我們只需收集所有數據並向目標受眾提供有針對性的廣告)之間是否存在某種競爭鬥爭?每個人 )? 作為直接參與的人,您對誰會獲勝有何看法——藝術家、技術人員,還是會產生某種協同效應?

Arthur Khachuyan:行銷中的人工智慧

哦: – 聽著,好吧,他們一起工作。 工程師沒有拿出創造力。 那些有創造力的人不會創造觀眾。 這裡有某種多學科的故事。 現在真正的問題是那些坐著按按鈕的人,那些做「猴子工作」、每天按同樣的事情的人——這些人將會消失。

但分析數據的人自然會留下來,但必須有人處理這些數據。 一定有人想出這些圖畫,把它們畫出來。 機器不可能有這樣的創造力! 這完全是瘋狂! 或者像 Carprice 的病毒式廣告一樣,順便說一句,效果非常好。 請記住,YouTube 上有這樣一個廣告:“在 Carprice 上出售”,這絕對是瘋狂的。 當然,任何神經網路都不會產生這樣的故事。
總的來說,我支持這樣一個事實:人們不會失去工作,而是會擁有更多一點的空閒時間,並且能夠將這些空閒時間用於自我教育。

原始廣告將消亡

Z: - 總的來說,顯示的廣告、橫幅,甚至銷售文字都沒有寫在那裡:“你需要窗戶 - 拿走它!”,“你需要別的東西 - 拿走它!”,也就是說,那裡根本沒有創造力。

哦: – 當然,這樣的廣告遲早會消失。 它會消亡,與其說是因為科技的發展,不如說是因為你我的發展。

最好將相關內容與不相關內容混合在一起

Z: - 我在這! 我對你所說的實驗有疑問(使用推薦系統)。 在您看來,問題是那裡簽名的內容,為什麼推薦它,還是用戶看到的所有內容似乎都與他相關? 因為我讀了一個針對母親的實驗,當時還沒有那麼多數據,也沒有那麼多來自網路的數據,只有一家雜貨零售商預測懷孕的數據(她們將成為母親)。 當他們向準媽媽們展示一系列精選產品時,媽媽們都驚恐地發現,她們比任何官方消息都早發現了這些產品。 但它不起作用。 而為了解決這個問題,他們刻意將相關產品與完全不相關的東西混合在一起。

Arthur Khachuyan:行銷中的人工智慧

哦: 「我們專門向人們展示了提出建議的依據,以便了解他們的回饋。 實際上,這就是這個概念的誕生之處,人們不需要被告知這些是與他超級相關的產品。

是的,順便說一句,有一種方法可以將它們與不相關的東西混合在一起。 但也有相反的情況:有時人們會進來並與這種不相關的產品進行互動 - 隨機異常值會出現,模型會崩潰,事情會變得更加複雜。 但這確實存在。 此外,許多公司故意,如果他們知道有人正在處理他們的數據(有人可以從他們那裡竊取此類輸出),他們有時會混淆它,以便他們以後可以證明你沒有從其推薦系統中獲取數據,而是從所謂的 Yandex.Market。

廣告攔截器和瀏覽器安全

Z: - 你好。 您提到了 Ghostery 和 Adblock。 您能否告訴我們此類追蹤器的整體效果如何(也許基於統計數據)? 你們有沒有收到公司的訂單:他們說,確保我們的廣告不會被Adblock關閉。

哦: – 我們不直接聯絡廣告平台 – 正是這樣他們就不會要求讓每個人都看到他們的廣告。 我個人使用 Ghostery——我認為這是一個非常酷的擴充。 現在所有瀏覽器都在為隱私而戰:Mozilla 發布了一系列各種更新,Google Chrome 現在超級安全。 他們都竭盡全力阻止一切。 《Safari》甚至預設關閉了「陀螺儀」。
而這種趨勢當然是好的(對於那些收集數據的人來說不是,儘管他們也從中脫身),因為人們首先屏蔽了cookie。 每個擁有廣告網路的人都記得瀏覽器指紋這樣一項奇妙的技術- 這些演算法接收60 個不同的參數(螢幕解析度、版本、安裝的字體),並根據這些參數計算出唯一的“ID” 。 讓我們繼續討論這個。 瀏覽器開始為此苦苦掙扎。 總的來說,這將是一場永無止境的泰坦之戰。

最新的開發者 Mozilla 是相當安全的。 它幾乎不保存 cookie,並且生命週期很短。 尤其是如果你打開“隱身”,根本沒有人會找到你。 問題是所有服務都需要輸入密碼,會很不方便。

心理分型和麵相學在哪裡起作用,在哪裡不起作用?

Z: – 亞瑟,非常感謝你的演講。 我也喜歡在 YouTube 上觀看您的講座。 您提到行銷人員越來越多地使用心理分型和外觀分析。 我的問題是:這適用於哪些品牌類別? 我相信這只適合快速消費品。 例如,選擇一輛車...

哦: – 我可以下載它確切的工作位置。 這適用於各種故事,如“Amediateka”、電視劇、電影等。 這在銀行和銀行產品中效果很好,如果它不是高端市場,而是各種學生卡、分期付款計劃等。 這在快速消費品和各種 iPhone、充電器以及所有這些垃圾中確實非常有效。 這在“媽媽和流行”產品中效果很好。 雖然我知道在釣魚中(有這樣一個主題)......已經有好幾次漁民的案例 - 他們永遠無法可靠地分割。 我不知道為什麼。 某種統計誤差。

這對駕駛者、珠寶或某些家居用品較不適用。 事實上,它不適用於人們永遠不會在社交媒體上寫的事情 - 你可以這樣檢查。 傳統上,購買洗衣機時:如何了解誰有洗衣機、誰沒有? 好像每個人都有。 您可以使用 OFD 資料 - 查看誰使用收據購買了什麼商品,並使用收據來匹配這些人。 但事實上,有些事情你永遠不會談論,例如在 Instagram 上 - 處理這些事情很困難。

機器將技巧識別為統計填充。

Z: – 我有一個關於定位的問題。 是否有可能(或突然存在)一個在所有事情上都自相矛盾的條件隨機角色:首先他在谷歌上搜索“最好的健身房”,然後他在谷歌上搜索“10種無所事事的方法”? 凡事都是如此。 目標定位能否追蹤自相矛盾的事物?

哦: – 這裡唯一的問題是:如果你已經使用谷歌兩年了,告訴它你能告訴它關於你自己的一切,現在為自己安裝一個插件來編寫類似的隨機查詢,那麼,當然,從統計數據中你會能夠理解-你現在所做的事情是統計異常值,這都是篩選的問題。 如果您願意,可以註冊一個新帳戶,但廣告量不會改變。 她只會變得很奇怪。 雖然她還是很奇怪。

一些廣告🙂

感謝您與我們在一起。 你喜歡我們的文章嗎? 想看更多有趣的內容? 通過下訂單或推薦給朋友來支持我們, 面向開發人員的雲 VPS,4.99 美元起, 我們為您發明的入門級服務器的獨特模擬: VPS (KVM) E5-2697 v3(6 核)10​​4GB DDR480 1GB SSD 19Gbps XNUMX 美元或如何共享服務器的全部真相? (適用於 RAID1 和 RAID10,最多 24 個內核和最多 40GB DDR4)。

Dell R730xd 在阿姆斯特丹的 Equinix Tier IV 數據中心便宜 2 倍? 只有這裡 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 電視低至 199 美元 在荷蘭! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99 美元起! 閱讀 如何建設基礎設施公司同級使用價值730歐元的Dell R5xd E2650-4 v9000服務器一分錢?

來源: www.habr.com

添加評論