講座影片記錄文字記錄。
博弈論是一門介於數學和社會科學之間的學科。 一條繩子綁在數學上,另一根繩子繫在社會科學上,緊緊相連。
它有相當嚴肅的定理(均衡存在定理),而電影《美麗心靈》就是圍繞著它拍攝的,而賽局理論在許多藝術作品中都有體現。 如果你環顧四周,你時不時就會遇到遊戲的情況。 我收集了幾個故事。
我所有的演講都是由我的妻子來做的。 所有簡報都可以免費分發,如果您就此發表演講,我將非常高興。
有些故事是有爭議的。 模型可能不同,您可能不同意我的模型。
- 塔木德中的賽局理論。
- 俄羅斯經典博弈論。
- 電視遊戲或有關停車位的問題。
- 盧森堡屬於歐盟。
- 安倍晉三與朝鮮
- 梅特羅戈羅多克(莫斯科)的布雷斯悖論
- 唐納德·川普的兩個悖論
- 理性的瘋狂(又是北韓)
塔木德:繼承問題
一夫多妻制曾經被允許(三、四千年前)。 當猶太人結婚時,他會簽署一份婚前協議,說明他死後將向妻子支付多少錢。 情境:一個擁有三個妻子的猶太人快要死了。 第一個遺贈是3金幣,第二個是4金幣,第三個是100金幣。但當遺產開啟時,只剩下了不到200金幣。 怎麼辦?
關於猶太人解決問題的方法的題外話:
安息日從第一顆星星開始。 那麼北極圈之外呢?
- 沿著經絡“下去”,導航到一切正常的區域。 (不適用於北極)
- 從 00-00 開始,不要急。 (也不適用於北極),所以:
- 猶太人在北極圈無事可做,也沒有必要去那裡。
- 《塔木德》規定,如果遺產少於100枚硬幣,則平分。
- 如果最多300個硬幣,則除以50-100-150
- 如果有200個硬幣,除以50-75-75
如何將這三個條件合併到一個公式中?
如何解決合作博弈的原理。
我們寫下每個妻子的要求,一對妻子的要求,前提是第三個妻子已經「還清」了一切。 我們收到一份索賠清單,不僅包括個人索賠,還包括「公司」索賠。 做出這樣的決定,這樣分配遺產,使最重的要求盡可能最小(最大最小)。 這在博弈論中被研究並稱為“
怎麼會這樣? 3000年前? 我和其他人都不明白這是怎麼回事。 (是上帝規定的嗎?還是他們的數學比我們想像的要複雜得多?)
尼古拉·瓦西里耶維奇·果戈理
伊哈列夫。 讓我問你一個問題:你之前使用牌組做過什麼? 賄賂僕人並不總是可能的。
令人安慰。 上帝禁止! 是的,而且很危險。 這意味著有時要推銷自己。 我們的做法不同。 有一次我們這樣做了:我們的代理人來到展會並以商人的名義住在城市的一家小酒館裡。 商店還沒有租用; 箱子和包裹仍在房間裡。 他住在一家小酒館裡,揮霍、吃喝——然後突然消失到天知道在哪裡,沒有付錢。 主人正在房間裡翻找。 他看到只剩下一包了; 打開包裝——一百打卡片。 這些卡牌自然是立即被公開拍賣。 他們以更便宜的盧布價格出售,商人立即在商店裡搶購一空。 四天之內,整個城市都淪陷了!
這是一個純粹的數論雙向技巧。 最近,我在秋明進行了一次雙向旅行。 我要坐火車去。 我研究了一下情況,要求坐在包廂最上面的座位。 他們告訴我:“不用存錢,抄底,錢不是問題。” 我說:「頂」。
為什麼我要坐最上面的座位? (提示:我完成了任務3/4)
ответ結果我就有了兩個地方──上、下。
較低的則貴一倍半。 他們不佔用昂貴的地方。 我一看,上面的幾乎都被買完了,下面的幾乎都空了。 於是我就隨機選了最上面的一張。 只有在葉卡捷琳堡-秋明路段才有鄰居。
玩的時間到了
這是我的電話號碼。 手機本身沒有一條未讀短信,聲音已關閉。 一分鐘之內,您要么發送短信,要么不發送。 發送簡訊的人將收到巧克力,但前提是發送者不超過兩個。 時間已經過去了。
一分鐘過去了。 11則簡訊:
- 巧克力!
- 朱古力
- 簡單的
- 噓
- 123
- 你好阿列克謝·弗拉基米羅維奇
- 你好阿列克謝
- 巧克力 :)
- +
- 連擊破壞者
- А
在邁科普,阿迪格共和國的領導人正在聽我的演講,並提出了一個有意義的問題。
在克拉斯諾亞爾斯克,300 名積極主動的小學生坐在大廳裡。 138條簡訊。 我開始讀它們,第五個結果是淫穢的。
我們來看看這個遊戲。 當然,這是一個騙局。 在抽獎歷史上(接近 100 輪)從未有人獲得巧克力棒。
當觀眾對某些兩個人達成一致時,就會出現平衡。 該協議必須是一項讓每個人都能從參與中受益的協議。
Equilibrium 是一款你可以大聲宣布策略並且策略不會改變的遊戲。
假設一塊巧克力比一封簡訊貴100倍(如果是1000,那麼結果會有點不同)。 大廳裡的人數幾乎起不到任何作用。
混合平衡。 你們每個人都有疑問,不知道怎麼玩。 他把自己的道路交給了機會。 例如,輪盤賭是 1/6。 該人決定在 1/6 的時間(多場比賽)中發送簡訊。
問題:哪一個「輪盤賭」會達到均衡?
我們想要找到一種對稱的平衡。 我們向每個人分發輪盤 1/r。 我們需要確保人們願意玩這種輪盤。
一個重要的細節。 如果你理解了它,就認為你已經熟悉了博弈論。 我認為只有一個“p”與均衡相容。
我們假設“p”非常小。 例如 1/1000。 然後,收到這樣的輪盤賭後,您很快就會意識到看不到巧克力,您會扔掉這樣的輪盤賭並發送簡訊。
如果「p」太大,例如1/2。 那麼正確的決定就是不發送簡訊並節省盧布。 你肯定不會是第二,但很可能是四十第二。
有一個平衡的計算,同時有深入的思考。 但現在我們不是在談論它們。
「p」的值應該使您透過發送簡訊獲得的平均獎金等於不發送簡訊獲得的獎金。
我們來計算一下這個機率。
N+2是觀眾人數。
影片第33分鐘進行了公式解析。
(1+pn)(1+p)^n = 1/100 (巧克力的機率=簡訊的價格)
如果輪盤賭是由所有其他參與者獨立啟動的,則如果您發送短信,則有可能收到巧克力棒(等於 0,01)。
當巧克力/簡訊的價格比 = 100 時,簡訊數量將為 7 條,即 1000 - 10 條。
你會看到集體理性受到損害。 我們正在尋找一種平衡,讓每個人都理性行事,但結果幾乎肯定會是更多的簡訊。 只有互相勾結,才會有更多的結果。
博弈論的結果之一——自由市場將自行解決一切的想法——是完全錯誤的。 如果他們聽之任之,情況會比他們同意更糟。
盧森堡在歐盟
準備好笑吧。
盧森堡是歐盟的一部分。
歐盟部長理事會由 6 名代表組成,每個歐盟國家各一名(1958 年至 1973 年)。
這些國家不同,因此:
- 法國 德國 義大利 - 各 4 票,
- 比利時、荷蘭 - 2 票,
- 盧森堡 - 1 票。
連續15年,所有問題都由六個人做出決定。 如果超過配額則做出決定。 配額 = 12...
盧森堡不可能透過投票來改變決定的進程。 一個人在一張桌子上坐了 15 年,但從未做出任何決定。
當我發現此事時,我請我的德國朋友(我沒有盧森堡的朋友)發表評論。 他們回覆說:
— 不要將盧森堡與你們的蘇聯陣營進行比較,那裡的數學是眾所周知的。 他們不知道偶數/奇數。
- 什麼,整個國家?!???!?
- 嗯,是的,除了幾位老師。
我問了另一位與盧森堡人結婚的德國人。 他說:
——盧森堡是一個完全不關心政治、完全不遵循外交政策的國家。 在盧森堡,人們只對自家後院發生的事情感興趣。
安倍晉三
我在去聽博弈論講座的路上看到了這樣的新聞:
我的警鐘開始響起。 這不可能是真的。 決不。 北韓有能力製造原子彈,但不太可能交付。
為什麼要故意引入錯誤訊息?
事實是飛彈可以到達日本。 這對日本人來說是可怕的。 但如果你告訴北約這一點,不會有任何結果,但用「歐洲」嚇唬會帶來結果。
我並不堅持我是對的;可能還有其他對此新聞的分析。
鐵道鎮
曾幾何時,小丑們稱這條街為“開放高速公路”,因為它是一條死胡同,盡頭是森林。 同樣的笑話者稱該地區為“鐵道鎮”,因為那裡永遠不會有地鐵。”
90年代初期,交通還沒擁堵,下面的故事就上演了。
大都會城鎮標有字母“M”。
謝爾科夫斯科耶高速公路連接著巨大的城市群。 根據最新的人口普查,有 700 萬人。
一條蜿蜒的小路從 Metrogorodok 通往 VDNKh,沒有任何紅綠燈。 高速公路行駛20小時,沿小路行駛30分鐘。 有些人開始從高速公路抄近路-結果導致塞車XNUMX分鐘。
這正是來自博弈論。 如果交通堵塞的時間遠少於 30 分鐘,這是已知的,然後更多的汽車就會轉向「插道」。 如果它高得多,人們就會停止切割。
交通壅塞時間的均衡值純粹是駕駛者決定去往何處的數論交互作用的結果。 沃德羅普原則。
對於司機來說,仍然是一個小時,但對於 Metrotown 的居民來說,20 分鐘變成了 50 分鐘。沒有連接器,1 小時 20 分鐘,有連接器,1 小時 50 分鐘。 純粹布雷斯悖論。
這是一個值得的例子
這就是想法。 如果新道路的出現會導致交通狀況惡化,那麼也許某種禁令可以帶來改善。 他描述了這種情況發生時的具體情況。
有「A」點和「B」點,中間有一個無法迴避的點。
結果,大家出遊時間為1小時20分鐘。 內斯特羅夫建議豎起「變換車道」標誌。
結果,車子被分成了兩類:直行再繞道的(4000輛)和繞道再直行的(4000輛),而且狹窄的直道上並沒有堵車。 結果,所有道路使用者的行程時間均為 1 小時。
流浪漢
投票支持川普的人比反對他的人少。
選舉人。
第一個州有8萬人,全部「反對」川普。 2名選舉人。
第二州有12萬人,8人“支持”,4人“反對”。 有3名選舉人,每個人都有義務投票給川普。
結果,選舉人票以2:3的比例支持川普,儘管有8萬票支持他,12萬票反對他。
可恥的候選人
碰巧有候選人未能通過民調。 或者關於英國脫歐,根據民意調查,它不應該發生。 有一些品質很差的調查(當樣本中排除了令人反感的意見時),但專業社會學家很少這樣做。
一個人的生活就像穿著長袍,說一件事,在投票箱前脫下長袍,以不同的方式投票。 住在長袍裡方便;有一定的社會環境:雇主、家庭、父母。
這是我朋友的模型,因為我沒有 Facebook。 所有這些人都以某種方式影響著他。
500 人的意見很重要。 如果我和他正在討論政治,而我們意見分歧很大,就會有些輕微的不適。
社會分裂的模型。
Примеры:
- 英國脫歐
- 俄羅斯與烏克蘭的分裂
- 美國大選
有些人原則上不參與爭論,這是他們的立場,不是因為他們沒有自己的觀點,而是因為表達觀點的成本非常高。
您可以編寫一個獲勝函數:
存在一個交互矩陣 aij (數百萬乘數百萬)。 每個單元格中都寫有每個人如何相互影響以及熟悉程度。 高度不對稱的矩陣。 一個人可以影響很多人,但一個人可以影響200人。
我們將人的內在狀態 vi 乘以他大聲說出的內容 σi。
均衡是指每個人決定大聲廣播哪一個 σ 。
他們甚至可以同時思考一件事,同時大聲說出另一件事。 兩人都撒謊,但他們團結一致。
添加了更多噪音。 它會計算出你保持沉默(說「支持」或「反對」)的機率。 這組機率出現方程式。
我們必須開始計算與熱情和狂熱者的平衡。
電視是改變內心觀點的磁場。
您「為」任何特定一方而下沉的機率等於白噪音差異大於獎金的機率。 一切都是由括號內的值決定的,而這個值是根據其餘的值來獲得的。 結果是一個方程組。
用白噪音建模公式:
事實證明,每個人有兩個方程,100 億人 - 200 億個方程。 很多。
也許有一天,我們可以利用民意調查數據,檢查社交約會網絡的定量指標,並說:“在這個系統中,民意調查將使該候選人的選票數減少 7%。”
理論上可能是這樣。 不知道路上還會有多少障礙。
發現
人們尷尬地支持一個「可恥的」候選人(日里諾夫斯基、納瓦尼等),但在投票箱裡他們「發洩抗議」。 透過求解這個方程組,我們可以量化民調結果與實際投票結果的偏差。 但社交網路的複雜性阻礙了我們的發展。
理性瘋狂模型
許多人對北韓領導層在美國「鼻子底下」測試核武的「無所畏懼」感到驚訝。 特別是考慮到卡扎菲、薩達姆等人的命運,金正恩瘋了嗎? 然而,他的「瘋狂」行為很可能有理性的成分。
這就是凱撒過河拆橋的模型。
一旦發生戰爭,擁有核武的國家就會被徹底毀滅。 如果它沒有核武器,就可以在不徹底毀滅的情況下將其擊敗。 如果國家領導人知道“要么是災難,要么是災難”,那麼就會將巨大的資源花在戰爭上。 而如果是這樣的話,那麼對方就會害怕這些大量的資源,因為它本身就會因為戰爭而遭受很大的損失。
博弈樹和預測。
聚苯乙烯
舉手,誰認為未來五年內會投下原子彈?
我認為是50%。 我會舉起半隻手。
只有註冊用戶才能參與調查。
未來五年內投下原子彈的機率有多大?
-
小於 5%
-
5,20%
-
20,40%
-
企業排放佔全球 50%
-
60,80%
-
更多95%
-
其他
256 位用戶投票。 76 名用戶棄權。
來源: www.habr.com