試閱 1/2

心中有數,腳下有路:用數學思維解讀世界、解決生活中的難題

第7章 龐帝克汽車與香草冰淇淋──條件獨立

先來講一個很有趣的故事。

汽車和冰淇淋

通用汽車有一個品牌叫龐帝克,相關部門曾經收到某位顧客的郵件投訴,該封信內容如下:

這是我第二次寫信給你,我不怪你不回覆我,因為我知道這聽起來很瘋狂,但它是一個事實。我家有個傳統:晚飯後去吃冰淇淋,每天晚上我們都開車去買不同口味的冰淇淋。我發誓我說的都是真的,我最近購買了一輛龐帝克,但是去買冰淇淋時我發現了一個問題:每當我買香草冰淇淋,汽車都發不動,但如果我買其他口味的冰淇淋,汽車就會很好地啟動。我非常嚴肅地看待這件事,不管你覺得我有多麼愚蠢,我都想知道,為什麼龐帝克每次遇到香草冰淇淋就無法順利發動?

汽車公司的經理雖然很懷疑事情的真實性,但還是派了一位工程師調查這個問題。工程師和車主見了面,約定一起去買香草冰淇淋,他們到了商店,買完冰淇淋,車子果真發不動了。

工程師盡量還原現場,並連著三天晚上開車去買冰淇淋。

第一晚,買巧克力口味的,車子啟動了。

第二晚,買草莓口味的,車子也啟動了。

第三晚,買香草味口味的,車子就不動了。

這到底是怎麼一回事?

這位工程師非常細心,在這幾次和顧客一起買冰淇淋的過程中,他詳細記錄了過程中的每一個細節,並分析了這些細節,希望找出買香草冰淇淋的過程和買其他口味冰淇淋的過程中所有的不同之處。

真相果然隱藏在細節裡。工程師發現,買香草冰淇淋所用的時間遠比買其他口味的要短。

香草冰淇淋賣得最好,被放在距離商店門口最近的地方,不需要翻找,直接拿起來付錢即可。而其他口味的冰淇淋被放在商店較靠後面的位置,多種口味混合放在一起,不只要走到相應位置,還要翻找想要的口味,所花時間明顯比買香草冰淇淋更久。

購買時間和車子的啟動又有什麼關係?工程師對這個顧客的汽車進行了檢查,發現「氣阻」問題。氣阻通常在引擎較熱時產生,如果汽車的供油系統中出現氣阻,引擎吸燃料時,燃料的供應會變得斷斷續續,汽車會因此無法啟動或在行進間熄火。

這位顧客購買的龐帝克汽車就有氣阻的問題。購買其他口味冰淇淋花費的時間足以讓引擎冷卻,從而讓車順利啟動;而當顧客購買香草冰淇淋時,時間短,引擎過熱,氣阻無法及時消失,汽車因此無法啟動。

工程師解決了顧客汽車的氣阻問題,這位顧客以後在購買任何口味的冰淇淋時,再也沒有出現車子無法啟動的情況。

條件獨立

大部分人看完上述故事的收穫是:有時候問題看起來無解,但在冷靜思考後會發現它的確可以被解釋。不過,在本書中我想更深入地分析這個故事。故事中包含了一個數學概念──條件獨立。

條件獨立和條件機率有關。我先介紹什麼是條件機率。條件機率通常寫成P(A|C)的形式,即在事件C發生的情況下,事件A發生的機率。

例如,下雨天通常選擇搭車上班。在這個例子裡,C就是「下雨天」,A就是「搭車」,而P(A|C)就是一個接近1的機率值(下雨天通常會搭計程車)。如果去掉這個條件,P(A)就是一般情況下你搭計程車的機率(可以藉由統計一年有多少次搭計程車去上班得出)。明顯可見,P(A|C)和P(A)是不同的。

知道了什麼是條件機率,就可以給出條件獨立的定義。在數學上,如果事件A和事件B關於事件C條件獨立,那麼有:

    P(B|A, C ) = P(B|C )

    P(A|B, C ) = P(A|C )

P(B|A, C )是在事件A和事件C同時發生的情況下,事件B發生的機率;P(B|C )是在事件C發生的前提下,事件B發生的機率。這個公式告訴我們,在條件獨立的情況下,這兩個機率是相同的。

為了更清楚地解釋這兩個機率相同的含義,我們假設有兩個人,他們都知道事件C發生了,但是第二個人除了知道事件C發生了,還知道事件A發生了。現在這兩個人要根據自己掌握的資訊,推斷出事件B發生的機率。

用數學公式來表達,第一個人要得到P(B|C ),而第二個人要得到P(B|A, C )。

一般來說,第二個人知道的訊息更多,其推斷出來的事件A發生的機率也會和第一個人不同。但是在條件獨立的前提下,P(B|A, C )= P(B|C ),這兩個人得出的結論完全一樣。

也就是說,如果事件A和事件B關於事件C條件獨立,那麼在知道事件C發生的前提下,知道事件A發生並不能幫助我們更好地推斷事件B發生的機率。

同樣有:

    P(A|B, C ) = P(A|C )

這個公式告訴我們,如果事件A和事件B關於事件C條件獨立,那麼在知道事件C發生的前提下,知道事件B發生並不能幫助我們更好的推斷事件A發生的機率。

總結一下,如果事件A和事件B關於事件C條件獨立,那麼在知道事件C發生的前提下,知道事件A或事件B中的一個是否發生,並不能幫助我們更好地推斷出另外一個事件發生的機率。

這就是條件獨立的核心思想。

條件獨立案例

我們以上文為例,其中事件A是「購買香草冰淇淋」,事件B是「車啟動不了」,事件C是「購買時間短」。

「車啟動不了」的內在原因是「購買時間短」,而不是「購買香草冰淇淋」。如果我們知道這位顧客某次「購買時間短」,那麼不管他這次是否購買香草冰淇淋,我們都可以推斷出這一次「車子發不動」的機率極高。

也就是說,在「購買時間短」這個事件發生的前提下,知道「購買香草冰淇淋」並不能幫助我們更好地推斷「車子發不動」的機率。「車子發不動」和「購買香草冰淇淋」關於「購買時間短」條件獨立。我們用圖7-1來表示這個例子,事件A是「購買香草冰淇淋」,事件B是「車子發不動」,事件C是「購買時間短」。因為事件A很可能導致事件C發生,事件C很可能導致事件B發生,因此A、B、C的關係如圖7-1所示。

從統計意義上來說,事件A(購買香草冰淇淋)和事件B(車子發不動)看似有關係(每次購買香草冰淇淋時,車子都發不動),但是中間隔了一個事件C(購買時間短)。在這種結構下,事件A和事件B在事件C發生的情況下條件獨立。

兩個事件看似相關,實則關於另外一個事件條件獨立的情況非常普遍。如果意識不到這一點,就很容易犯了把「相關性」當成「因果性」的錯誤。我們來舉幾個例子。

穿夾克和車禍發生率

一項調查發現,每當倫敦的計程車司機穿夾克,發生車禍的機率都會大大增加。

很多人猜想是穿夾克導致司機的操作不便,從而增加了事故發生率。這項調查幾乎促成了英國通過立法禁止計程車駕駛員穿夾克。

經過仔細研究才發現,天氣才是背後的根源:下雨時,司機經常穿夾克;下雨時,發生車禍的機率大。

也就是說,我們知道了「下雨天」,自然就可以推斷出「發生車禍」的機率比較高;而「司機穿夾克」實際上並不能幫助我們更好地推測「發生車禍」的機率。因此,「穿夾克」和「發生車禍」這兩個事件關於「下雨天」條件獨立。

這個例子中,事件A是「穿夾克」,事件B是「發生車禍」,事件C是事件背後共同的原因:「下雨天」,三者的關係如圖7-2所示。

「穿夾克」和「發生車禍」具有統計意義上的相關性,但這兩個事件之間沒有因果關係,它們關於「下雨天」這一事件條件獨立。

 

第12章  夾娃娃機的致勝要訣──—大數法則

在開篇前,我要特別強調一點:賭博的危害很大,切勿沉迷。本書中僅用此例討論機率與演算法。

本章將從數學的角度來談談賭場莊家如何從賭客手中不斷賺錢。當你明白了這個道理,就會明白為什麼沉迷賭博的人最終總會傾家蕩產。此外,我們還會介紹一些從中得到的啟示。

大數法則

賭場的遊戲是由賭場莊家設計的,在設計每一個賭局時,一定會在機率上讓莊家比普通玩家多占一點優勢。

我們以輪盤為例(見圖12-1)。輪盤賭博的玩法十分簡單:一個轉盤被分為38格,由玩家猜測射入轉盤的小球停在哪個格子,猜對了,賭場通常會以35:1的比率賠錢給玩家。也就是說,你押1元,如果押對了,那麼你不僅拿回這1元,而且莊家還會再給你35元;如果押錯了,你就損失了你押的1元。

因為有38個格子,所以玩家猜中小球落在哪個格子裡的機率是1/38。機率是一個數學概念,為了詳細說明「1/38」的機率到底是什麼意思,我們假設一個玩家玩了非常多次遊戲,然後對他的猜測結果是否正確進行統計。

因為玩家每次要麼猜「對」,要麼猜「錯」,所以我們直接把玩家每次的「對錯」進行排列,那麼最後可能是這樣的:

錯對錯錯錯錯對錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯對錯對錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯對錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯錯……

這些結果可能也只是一部分,如果玩家玩的次數足夠多(例如1萬次),統計這1萬次中「對」的次數占所有次數的比例,就會發現它非常接近1/38。也就是10000×1/38≈263(次)。這就是「1/38」這一機率的實際含義。

注意,上面的方法實際上統計了猜「對」的頻率。也就是說,在次數夠多的情況下,「出現某一個結果的頻率」等於「該結果的機率」。

在統計學中,有個名為「大數法則」的詞彙解釋了這一現象。大數法則是統計學的基石,它是指只要一件事情發生的次數夠多,出現某一個結果的頻率就會等於其機率。

我們注意到,大數法則的成立需要滿足「發生的次數夠多」此一條件。只有發生的次數夠多,統計出來的頻率才會等於機率;並且發生的次數越多,統計出來的頻率越接近機率。

來看一下玩家在玩的次數夠多的情況下的收益情況。假設他每次押1元,押了1萬次,那麼根據機率,他猜對的次數應該非常接近263次。由於每猜中一次會得到36元,所以他猜一萬次的收益大致為263×36=9468(元)。

但因為他一共投入了1萬元,所以算下來他虧了大約500元。

注意,500元雖然不多,卻是穩定的虧損。因為只要玩的次數夠多,猜對的頻率就會非常接近1/38。這個機率下,每玩一局下注1元,只有1/38的機率可以拿回36元,因此平均每局要虧:

1-36/38=1/19(元)

這就是「久賭必輸」的數學原理。

我們可以看出,在設計遊戲時,莊家總會讓自己的獲勝機率比玩家高一點。這個優勢通常很小,為5~10%。但是不要小瞧這一點點機率優勢。莊家在有這一點機率優勢的前提下,讓投注的次數變多。這樣一來,根據大數法則,莊家就可以穩定地賺錢了。

有人可能會問,我投注的次數並不多,為什麼大數法則還是能發揮作用呢?注意,雖然每個人投注的次數不多,可是到賭場投注的人很多;莊家不是和你一個人賭,而是和所有到賭場投注的人賭,所以在機率方面,所有人的投注都會被計算在內。這些投注次數加在一起,當然足以讓大數法則實現了。

因此我們可以知道,賭場最歡迎的,就是那些經常去玩的玩家。此外,賭場還會想方設法地增加投注次數。

夾娃娃機的發展

不僅賭場會利用大數法則穩定地賺錢,這種思想也已經迅速被不同行業的商家所利用,我們以夾娃娃機為例。

我上大學時也玩過夾娃娃機,和當前有三根爪的娃娃機不同,我那時候的夾娃娃機只有兩爪。但是好處是,只要那兩爪把玩偶抓住了,通常就可以把玩偶夾出來。因此,戰績如何很大程度取決於玩家的技術。有經驗的人能夠找準位置下爪,經常可以夾起一大堆。我記得有一天晚上,我在某商場玩了一小時,夾了一袋子玩偶。

不過最近幾年,夾娃娃機升級了。首先爪子從兩根變為三根。但是這並非關鍵,最關鍵的是夾娃娃機的爪子的鬆緊規律變得可以設定了!例如,商家可以把爪子這一次夾緊的機率設成1/10,這意味著平均每夾10次,爪子有9次會在升起來時鬆掉。如果你玩過夾娃娃機就知道,如果這次爪子是鬆的,那麼你幾乎不可能把玩偶夾出來。

就機率的設定這可說是革命性的發展,意味著商家擺脫了「玩家的技術」這個桎梏,直接在機率層面和玩家玩這個遊戲。

如果設定玩一局需要2元,每個玩偶的價格是10元,商家把爪子夾緊的機率設成1/10,那麼玩家玩一局的平均損失就是1元。這同樣根據大數法則,玩家玩的次數越多,實際情況就越符合這個平均損失。

我們可以看出,夾娃娃機的商家同樣利用了「機率優勢」與「大數法則」。只要參與的人數夠多,他們就可以一直處於不敗之地。至少在我身上印證了這個改變。近十幾年,我夾起來的玩偶屈指可數,再也沒有重現多年前的戰績。

close
貨到通知