1.寫在前面
前幾天和同僚聊了個問題,覺得還蠻有趣,決定和大家分享一下。
Oh My God! 搞它搞它!
![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLicmbwxCdh1mcvZ2LcV2Zh1Wa9M3clN2byBXLzN3btg3P3FlaOZ3YXJWMoNjVhJ1RWRTOF9EUCRVWwxGVi5mRXFmNKBDZ1YlbVVjQY10MstWV592ROhkSxkVaoRlUwYFValGbHV1ROhFZwQmVNpGZtlFcW1WTPZFbVFTUwM1MVJjT5NGSVFDZ6lVRax2Y4FkaXhnRU1keaV1UCR3VRNTO5pVdCNDW2wWbZRXMywUdO1GTqx2RjhXNpVGcKdlY0lTeMZTTINGMShUYvwlbj5yZtlmbkN3YuQnclZnbvN2Ztl2Lc9CX6MHc0RHaiojIsJye.jpg)
2. 題目描述
我們的熱心讀者小明被選中參加一個抽獎遊戲,遊戲規則是這樣的:
- 小明面前有ABC三扇相同的門,小明和觀衆無法知道ABC三扇門背後有什麼。
圖解|什麼是蒙提霍爾問題(三門問題) - ABC三扇門中隻有一扇門背後有一輛汽車,其他兩扇門背後都是一瓶礦泉水。
- 小明需要在3扇門中選中一個并且不開啟,接下來主持人從另外兩扇門中選中一扇門并且開啟。
- 小明選中了A門,主持人選中了B門,并且開啟B門後是礦泉水。
- 這時主持人問小明,明哥你要不要從A門換選C門呢?
大家都替小明思考一下,别瞎蒙,要有理有據,能不能提到這輛法拉利就在此一搏了!
3. 蒙提·霍爾問題
相信很多老鐵知道這個問題,這就是有名的蒙提霍爾問題(Monty Hall Problem),也稱三門問題。
這是一個源自博弈論的數學遊戲問題,出自美國的電視遊戲節目Let's Make a Deal。
這裡面有個非常重要的線索:主持人知道哪扇門後有汽車且會選中背後有水的那扇門,這也是争議的所在,相當于個隐含條件吧。
在維基百科對于Monty Hall問題的描述中,門的背後是山羊和汽車,本文替換成了礦泉水,但是數學原理是一樣的,大白是想盡量排除幹擾,避免讀者鑽牛角尖。
面對這個問題,很多人認為換或者不換選中汽車的機率都是1/2,還有一部分人認為應該換了之後的機率更大是2/3。
4. 樸素分析
換或者不換,是個問題。
4.1 不換的1/2派
由于主持人已經幫小明淘汰了一個選項,剩下的就隻有兩個了。
很直覺地感覺一下,A門和C門背後有汽車的機率都是1/2,這個結論也是符合大部分人直覺第一感覺的答案,這也是大白的第一答案...害
但是還有句話,真理往往掌握在少數人手中,是以這個直覺答案并不一定正确呀!
4.2 調換的2/3派
調換派認為不換的話有車的機率就是最初的1/3,由于B和C總體的機率為2/3,且已經被排除了B,那麼修改選擇後,選C有車的機率就是2/3。
詳細分析一下這幾種可能:
- A扇門背後有車,如果調換到C,那麼一定沒有車,這種場景的機率是1/3。
- A扇門背後無車,如果調換到C,那麼一定有車,這種場景的機率是2/3。
确實非常有道理,用一個低機率成功去換取一個高機率成功,太機智了!
4.3 分歧所在
在主持人沒有開啟B門之前,我們對選擇A後有汽車的機率是1/3是毫無争議的。
但是當主持人開啟B門之後,就出現了分歧,那麼不由得去想B門的開啟是否影響了之前的選擇A呢?
5. 數學分析
沒有數學分析,大家貌似說的都有道理,是以必須亮出大神器-機率分析。
這幾個機率論的術語,大家都是學過的,是以不必有什麼數學恐懼。
5.1 獨立事件的機率和條件機率
- 獨立事件機率
我們設定事件a的機率為P(a),事件b的機率是P(b),且事件a和事件b是互相獨立的。
則事件a和事件b同時發生的機率,滿足如下公式:
P(ab)=P(ba)=P(a)P(b)
- 條件機率
條件機率是在某種條件下,某個事件發生的機率,展示了事件之間的内在聯系和影響。
我們來看兩種條件機率的簡單表述。
- 事件a發生之後,事件b發生的機率,可以記做P(b|a),此時滿足公式:
P(b|a)=P(ab)/P(a)
等價于 P(ab)=P(b|a)P(a)
- 事件b發生之後,事件a發生的機率,可以記做P(a|b),此時滿足公式:
P(a|b)=P(ab)/P(b)
等價于 P(ab)=P(a|b)P(b)
- 綜合這兩種條件事件,可以得到公式:
P(ab)=P(b|a)P(a)=P(a|b)P(b)
5.2 貝葉斯公式
我們綜合計算得到一個公式:
P(b|a)P(a)=P(a|b)P(b)
這個公式做一個變形可以得到:
P(a|b)=P(b|a)P(a)/P(b)
沒錯,這就是大名鼎鼎的貝葉斯公式。
5.3 先驗機率和後驗機率
在貝葉斯公式中,還隐含着一些術語,來看下百度百科對于其中的定義:
P(A)是A的先驗機率或邊緣機率,它不考慮任何B方面的因素。
P(A|B)是B發生後A的條件機率,由于得自B的取值被稱作A的後驗機率。
P(B|A)是A發生後B的條件機率,由于得自A的取值被稱作B的後驗機率。
P(B)是B的先驗機率或邊緣機率,稱作标準化常量。
貝葉斯公式的意義非常重大,它揭示了條件事件機率的内在聯系,某些樣本資訊的出現對先驗機率的影響。
貝葉斯公式為我們利用搜集到的資訊對原有判斷進行修正提供了有效手段。
在很多領域都有非常深遠的影響,正好用在我們今天的蒙提霍爾問題上,繼續來分析。
6. 貝葉斯公式和蒙提霍爾問題
前面我們提到了,症結在于主持人選擇B門并開啟後無車,這個事件對于已作出選擇的參與者來說是否有影響呢?
後驗機率是否産生了影響,我們來推導一下:
- 設定A、B、C門後有汽車分别記為事件a、b、c,則P(a)=P(b)=P(c)=1/3。
- 設定參與者選擇了A門,由于主持人預設需要選擇沒有汽車的門,是以參與者的選擇影響了主持人的選擇。
- 設定主持人選擇了B門且沒有汽車,記為事件d,則P(d|a)=1/2,P(d|b)=0,P(d|c)=1。
- 在主持人選擇B門無汽車後,參與者選擇A門有車的機率為P(a|d),即事件d發生後事件a的機率,由貝葉斯公式得:
P(a|d)=P(d|a)P(a)/P(d)
通過前面的分析,我們隻需要求P(d|a)、P(a)、P(d)三個元素即可。
- P(d|a)表示A門有汽車的情況下,主持人選擇B門的機率,其為1/2;
- P(a)表示A門有汽車的機率,其為1/3;
- P(d)可以從全機率公式求得,其為1/2:
P(d)=P(d|a)P(a)+P(d|b)P(b)+P(d|c)P(c)
P(d)=1/2*1/3+0*1/3+1*1/3=1/2
綜上得到:P(a|d)=1/2*1/3*2=1/3
在主持人選擇B門開啟後無汽車的情況下,參與者選A門有汽車的機率P(a|d)=1/3,是以後驗機率并沒有發生變化,并不是直覺的1/2,而仍然是1/3。
是以如果做調換,那麼相當于參與者選擇了C門,計算過程類似,機率為2/3:
P(c|d)=P(d|c)P(c)/P(d)
7.蒙提霍爾問題的思考
想這個問題的時候,總覺得有漏洞,或者說必須在某些條條框框才能正常推演。
比如說假如主持人并不知道哪扇門後有汽車,他也是随機選擇的。
比如說資料規模不一樣,9扇門,主持人幫你否定7個,顯然要換,正是因為資料規模很小才帶來了和直覺相悖的感覺。
最後用Horst Hohberger的一段話概括,蒙提霍爾問題:
If you change, you win when your original choice was wrong;
if you don't change, you win when your original choice was right.
如果你想赢得汽車,兩種情況的機率:
- 不換情況下必須是最初選擇是對的才會赢取法拉利,機率1/3
- 調換情況下必須是最初選擇是錯的才會赢取法拉利,機率2/3
網上有一些大佬,寫代碼模拟這個獨立重複實驗,得到的結果也是一樣的。
今天先到這裡,感謝各位老鐵的傾情安排!