中場故事
(以下為AI初翻,尚待校稿)
本書的第IV部分是理論成份最重的單元,這部分的三個單元都是談統計推論的理論。接下來的三個單元裡,讀者們將認識機率論、取樣、 單元 8 了解如何估計參數,以及 單元 9 學習統計假設檢定。在我們開始之前,我想從比較高的層次談談這些主題。統計推論的主要功用是從資料裡獲得資訊,不僅僅是要描述資料的特徵,而是透過分析資料為基礎的推論,增加我們對世界的認識。為了激起同學們的思考,這裡要花些篇幅討論一個被稱為歸納謎題或古德曼悖論的哲學難題,這個悖論牽涉一個在本書不斷出現的問題:統計推論要符合適用條件(assumptions)才有用。這聽起來不大妙,我們經常聽到像是“永遠不要相信任何有適用條件的事物”的勸告,更不用說有很多心理學課程經常提到適用條件和偏見是人類應該避免的失誤。就個人的痛苦經歷,我(原作者)已經學會永遠不要在哲學家面前說出這樣的話!
邏輯推理的侷限
戰爭的藝術在於知悉每座山的後面是什麼,或者說,從我們所知道的事物學到我們所不知道的。
這句名言據說來自某次英國陸軍名將威靈頓公爵,與他的同伴J. W. Croker搭乘馬車經過鄉間前往戰場,一路上玩的一套猜謎遊戲,兩個人各自打賭每經過一座山,會看到什麼東西。玩到最後,每一次都是威靈頓猜中,Croker老兄全輸。多年之後有人問起威靈頓怎麼這麼會猜,他回答“整個戰爭的藝術在於知悉每座山的後面是什麼”。確實,戰爭就是比那一方最能料得先機。每天的日常生活在許多方面來看,都是有來有往的猜謎遊戲,要平要度過每一天,需要面對當下做出好的猜測。接著就來玩一場只有「我」和我的影子~「你」對話的猜謎遊戲。
假設你和我正在觀察Wellesley-Croker競賽,在每三座山之后,你我需要預測誰將贏得下一座山,Wellesley還是Croker。讓我們說W指的是Wellesley的勝利,C指的是Croker的勝利。在三座山之后,我們的資料集如下:
\(WWW\)
我們的對話如下:
「你」:三連勝並沒有太大意義。我猜Wellesley在這個遊戲上可能比Croker更擅長,但這也可能只是巧合。儘管如此,我還是有點賭徒精神。我會押註Wellesley。
「我」:我同意三連勝並沒有提供足夠信息,我也找不到任何理由更青睞Wellesley而不是Croker。我在這個階段不能證明下注是正確的。很抱歉,我不會下注。
「你」的賭注成功了:又過去三座山,Wellesley贏得了所有三座。進入我們遊戲的下一輪,比分是1比0,你獲勝,我們的資料如下:\(WWW\) \(WWW\) 「我」已將資料組織成三個資料塊,以便您可以看到哪個資料塊對應於我們在遊戲每一步可用的觀測。看到這個新資料塊后,我們的對話繼續:
「你」:很明顯,Wellesley 在這個遊戲中表現更好。我們都同意他會贏得下一場比賽,對吧?
「我」:這個結論真的有什麼邏輯依據嗎?在我們開始這場遊戲之前,前10次結果有很多可能的組合,我也不知道會是哪一種。\(WWW\) \(WWW\) \(WWW\) \(W\) 是一種可能,但 \(WCC\) \(CWC\) \(WWC\) \(C\) 和 \(WWW\) \(WWW\) \(WWW\) \(C\) 或者甚至 \(CCC\) \(CCC\) \(CCC\) \(C\) 也都是可能的。因為我根本不知道會發生什麼,所以我會說這些結果的可能性是一樣的。我假設你也是這樣想的,對吧?我的意思是,這就是“完全不知道”的意思,不是嗎?
「你」:我想是的。
「我」:那麼,我們的觀察從邏輯上排除了所有可能性,只剩下兩種:\(WWW\) \(WWW\) \(WWW\) \(C\) 或者 \(WWW\) \(WWW\) \(WWW\) \(W\)。這兩種情況都和我們目前觀察到的證據完全吻合,不是嗎?
「你」:是的,當然是的。你想說什麼?
「我」:那麼現在情況有什麼改變呢?在遊戲開始時,你會同意這兩種可能性同樣合理,而我們觀察到的證據也没有區分兩者的優劣。所以,這兩種可能性仍然同樣合理,我看不出有任何邏輯理由偏好其中一種。所以,是的,雖然我同意你的看法Wellesley的9連勝很令人印象深刻,但是我想不出任何理由認為他會贏得第10場。不押注。
「你」:我理解你的看法,但是我仍然願意嘗試下注。我押Wellesley。
在接下來的三場比賽中,Wellesley的連勝仍在繼續。Wellesley-Croker比賽的比分現在是12比0,我們遊戲的比分是3比0。當我們進入遊戲的第四輪時,我們的資料集如下:\(WWW\) \(WWW\) \(WWW\) \(WWW\) 對話繼續:
「你」:太好了!Wellesley再次取得三連勝,我也再次獲勝了。你得承認,我對他的判斷是對的!我想這一次我們都會押Wellesley,對吧?
「我」:我不知道該怎麼想。我覺得我們和上一輪的情況差不多,沒有太大變化。對於一系列13次未被排除的結果,只有兩種合法的可能:\(WWW\) \(WWW\) \(WWW\) \(WWW\) \(C\) 和 \(WWW\) \(WWW\) \(WWW\) \(WWW\) \(W\)。就像我上次說的那樣。如果在遊戲開始前所有結果都同樣合理的話,那么鑑於我們的觀察並没有排除其中任何一種,這兩種結果現在應該也同樣合理,不是嗎?我同意你的感覺,Wellesley正處在令人驚嘆的連勝中,但是哪裡有邏輯證據可以證明他會繼續保持下去呢?
「你」:我認為你很不合理。如果你需要證據,為什麼不看看我們的記分牌呢?你是統計學專家,一直在使用這種花哨的邏輯分析,但事實是你正在輸。我只是依靠常識,而我正在獲勝。或許你應該改變策略。
「我」:嗯,你說的有道理,我也不想輸,但是恕我直言,我看不出有任何邏輯證據證明你的策略比我的更好。在我看來,如果有其他人在觀看我們的比賽,他們會看到你取得了三連勝。他們的資料會像這樣:\(YYY\)。 在邏輯上,我認為這和我們第一次觀察 Wellesley 和 Croker 沒有兩樣。你三次獲勝並不算很有力的證據,我也不認為你的策略有任何優於我的地方。如果我不認為 \(WWW\) 是 Wellesley 比 Croker 更優秀的有力證據的話,那么我現在當然也沒有理由相信 YYY 是你比我更擅長這場比賽的有力證據。
「你」:好吧,現在我認為你在裝傻。
「我」:我看不出有什麼邏輯證據可以證明這一點。
了解統計理論不需要在乎適用條件嗎
我們可以從多個角度分析上面的對話,但是由于這本書的目標讀者是心理學家而不是哲學或推理心理學專業人士,我會簡單帶過。上面描述的有時被稱為歸納謎題。認為 Wellesley 12連勝是「你」贏得第13場比賽的非常有力證據,這種想法看起來非常合理,但是很難對這種信念提供恰當的邏輯證明。相反,儘管答案很明顯,但如果不依賴某些「你」沒有任何邏輯依據的適用條件,實際上不可能證明押注 Wellesley。
歸納作為哲學難題最常與大衛·休謨(David Hume)和納爾遜·古德曼(Nelson Goodman)的哲學工作聯繫在一起,但你可以在各個領域找到這個問題的例子,如文學作家(像是寫愛麗絲夢遊境的路易斯·卡羅 )和機器學習(“免費午餐”定理)。嘗試“從我們所知道的中學習我們不知道的東西”確實有些怪異。關鍵點是,如果你想了解世界上的任何事物,則適用條件1和偏見是不可避免的。這是無法逃避的,統計推論和人類推理一樣也是如此。在對話中,我試圖採取合理的人類推理,但是你所依賴的常識推理跟統計學家所做的没有區別。你在對話中“常識”那一半所依賴的隱含適用條件是 Wellesley 和 Croker 之間在技能上存在某些區別,你要做的就是設法找出他們之間的技能差異大小。而我的“邏輯分析”完全拒絕這種適用條件。我所願意接受的只是存在勝利和失敗的序列,并且我不知道會觀察到哪些序列。在整個對話中,我堅持認為在 Wellesley-Croker 比賽開始時所有在邏輯上可能的資料集都同樣合理,我修改信念的唯一方式就是消除與觀察事實不一致的可能性。
就其自身而言,這聽起來非常合理。事實上,它甚至聽起來像是良好的演繹推理的標誌。像福爾摩斯一樣,「我」的方法是排除不可能發生的事情,以期獲得真相。然而,正如我們所見,排除不可能的事情從未使「我」能夠做出預測。就其自身而言,「我」在對話中說的每一件事情都是完全正確的。無法作出任何預測是“不相信有任何適用條件”的邏輯結果。最終「我」輸掉了比賽,因為「你」接受了一些適用條件,而這些觀察結果是正確的。技能是真實存在的,「你」相信技能的存在,所以你能夠學習到 Wellesley 的技能勝過 Croker。如果你的學習依賴於一個不太合理的適用條件,你可能就不會贏得比賽了。
最後有兩件事情是讀者學習統計推論方法前應該了解的。首先,正如本書一直強調的,如果任何人想從資料學到任何東西,就必須設定適用條件。其次,一旦學習者意識到適用條件是必要的,那麼確保使用的方法符合適用條件就變得非常重要!符合較少條件的資料分析不一定比符合更多條件的分析好,這完全取决于這些適用條件對你的資料是否合適。在我們學習這本書的後半部時,我經常會指出某種統計方法所依賴的適用條件,以及如何檢查這些條件是否成立。
譯註~同學們也許在一些地方看過”hypothesis”與”assumption”都被翻成「假設」,但是在英文這兩個詞是有區別的。“hypothesis”是指根據某種科學理論,設定實驗結果可能是什麼樣子。“assumption”是指研究運用的收集與分析資料的技術,必須符合什麼條件才會有效。因此”hypothesis”翻成「假設」是合理的,“assumption”應該翻成「適用條件」。本書的用詞將依此原則翻譯。↩︎