貝氏機率,偽科學充斥社會的原因?(Bayesian Statistics, the ‘reason’ why pseudoscience prevails?)

Godfrey Leung
10 min readOct 27, 2018

--

(credits: S.Harris)

上年有線新聞節目《新聞刺針》對近年興起的動物傳心做了深入調查,訪問了 5 位傳心師並上堂聆聽工聯會所謂有認證,有證書的傳心課程[1]。結果最後動物傳心被踢爆只是騙局,被訪的5位傳心師雖然聲稱看過動物的相片後便可以和動物隔空對話,但他們看完記者提供「布歐」的玉照後不單止回覆的故事自相矛盾,甚至連「布歐」只是一隻玩具龜這個事實都看不穿。

報導出了後在社會與「傳心業界」帶來很大迴響。除了生物、物理學界有人出來與所謂有科學根據的「動物傳心業界」劃清界線,釐清甚麼才是量子糾纏 (quantum entanglement)[2] ,亦有不少人從科學、哲學、人性等各方面探討這個現象與其他偽科學出現背後的成因,研究為何這些看起來那麼匪夷所思的偽科學東西會有這麼多人相信。小弟今日也想談談這話題,不過是從比較學術性的另一方面 – —數學探討。

機率也有分類?貝氏機率是甚麼?

(credits: xkcd #1132)

又與數學有關?是呀,小弟雖然非科學/數學至上主義者,不過科學家與偽科學信徒怎樣看同一件事、一個假設/理論,有沒有預設立場這些討論的確是可以客觀地由數學中機率方面探討分析

在入正題前,小弟首先想問大家兩條可能會令大家「痴線」想爆頭,有關機率的數學題:

[一]小弟朋友家中有一對小朋友,他告訴小弟其中最少有一個是女孩(只是知那麼多,其他東西完全不知),那另一個也是女孩機率是多少?

[二]小弟去探另一位同樣有一對小朋友的友人。小弟本身不知道那對小朋友性別是甚麼,但友人家幫手開門的是一個女孩(假設開門的是那對小朋友中隨機一位)。那另一個小朋友是女孩的機率是多少?

(假設生男/女機會率同為 1/2 ,不考慮 LGBT)

兩條問題好像一樣,不過兩者答案是(可以)不同喔!(答案與詳細解釋請看文章結尾)

相信大家中學讀數時也學過簡單機率問題,好像擲骰仔擲到 1 、在一副啤牌中抽到 A 的機率是多少般。這些都是頻率論 (Frequentist probability) ,統計學裡的機率分析其實還有另一種,就是貝氏機率 (Bayesian probability)

from 852郵報,http://assets.post852.com/wp-content/uploads/2014/07/Vlaar.jpg

貝氏機率是由貝氏定理 (Bayes theorem) 所提供的一種對機率的解釋,它採用將機率定義為某個人對一個命題信任程度的概念。不同於頻率論中機率的分佈是固定並假設是已知(通常為平均分佈 uniform distribution 或高斯分佈 Gaussian distribution),貝氏機率的概念像賭博投注,講的是根據已知數據或資訊推測結果/背後的機率分佈。而且預測會隨著所得數據或資訊改變。簡單例子就像預測天氣,甚至極端預測如十二碼入與不入般,如果根據頻率論推測,隨時會從桂神「十二碼一是入一是不入」的金句得出射入十二碼,明天下雨的機率為 50% 這荒謬答案。另外用頻率論去討論明天會不會下雨,下球十二碼美斯或 C 朗射入與否這些情況本身便存在定義問題。因為明天/下球十二碼只會出現一次,即是統計上只會錄得下雨/無下雨,入/不入,用頻率去定義機率的話結果只會是 0 或者 100%…所以只有從貝氏角度出發,談你有多少信心事件結果會如此先符合討論情況。

貝氏定理,前設/先驗機率 (Bayes’ theorem, prior probability)

說了這麼久,貝氏機率與人們盲目相信偽科學又有甚麼關係呢?在解釋兩者關係前,首先要了解甚麼是貝氏定理。

(credits: https://upload.wikimedia.org/wikipedia/commons/thumb/1/18/Bayes%27_Theorem_MMB_01.jpg/1024px-Bayes%27_Theorem_MMB_01.jpg)

貝氏定理是一條關於兩件隨機事件條件概率 (conditional probability) 的定理。簡單說就是如果有兩件隨機事件 A 與 B ,那當已知 B 發生後 A 發生的條件概率 — — P(A|B) 和當已知 A 發生後 B 會發生的條件概率 — — P(B|A),兩者間存在著如上圖的關係。上圖 P(A) = 事件 A 發生機率, P(B) = 事件 B 發生機率。

貝氏定理應用的簡單經典例子包括蒙提.荷爾問題 (Monty Hall problem) 與罕有疾病的醫學檢測。假設一個國家中有 1% 的人患有某種罕見疾病。醫院為了找出所有患者,研發出一種針對這種病的醫學檢測法,準確率高達 99% 。這裡準確率是指真正的患者有 99% 對檢測法呈陽性反應, 1% 呈陰性;同樣地非患者有 99% 對檢測法呈陰性反應, 1% 呈陽性。那如果醫院隨機在國家中挑選一個人做檢測,而結果呈陽性,那這個人真的有病的機率是多少呢? 99%?錯啦,正確答案其實只得 50% ! 99% 準確率看起來好像很準,不過由於這種病屬罕見只得 1% 人有,所以檢測屬假陽性的人統計上數目其實與檢測屬真陽性一樣。 類似情況的詳細解釋可以看這裡[3]。

根據貝氏定理,科學家就可以有意義地討論數據,實驗結果怎影響他們對一個假設理論模型是否正確的信心(如上圖)。簡單例子就像擲骰子。假設你擲一顆骰子連續擲到 6 多達 N 次,那顆骰子被人做了手腳的機率是多少呢?到 N+1 次都是擲到 6 的時候你的看法又會怎變呢?貝氏定理/貝氏機率就可以解答到這些問題。不過貝氏定理只是說怎樣根據每次觀察結果去更新,修正原先的看法、模型,但從中我們不會知應選擇甚麼前設/先驗機率 (prior probability) 才對,即上圖的 P (模型 A)是甚麼才對。而選擇甚麼前設/先驗機率是會影響最後根據觀察結果得出的結論。

說回擲骰子的例子,假設你一開始未擲之前已經偏向相信顆骰子被人做了手腳,那只要連續擲到未必需要很多次 6 你便可能認定顆骰子真的被人做了手腳;相反如果你不大信顆骰子被人做了手腳而篤信自己「行運一條龍」,那可能就要連續擲到很多很多次6你才會信顆骰子真的被人做了手腳。當然只要有足夠多甚至不同類型的觀察結果,而又肯根據每次觀察結果修改前設/先驗機率,例如擲骰子足夠多次般,大部份人最後得出的結論應該會殊途同歸,除了兩類人: 100% 認定自己是對或人家是錯的人⋯⋯這兩類人即使有無限多而且不同種類的觀察結果或數據都不會改變睇法,某程度上就像某些偽科學、反氣候轉變信徒。正如 Nate Silver 《The Signal and the Noise》一書所講,和這類人討論根本是浪費心機與時間,因為他們永遠可以自圓其說,為自己的看法找到「辯解」…科學家雖然不是萬能,一樣可能存有個人偏見,但他們基本上是會盡量客觀地看一件事或模型,歡迎並鼓勵合理客觀的討論。他們很少真的會 100% 認定自己是對或錯,除了某些科學至上的人。不過這類人某程度上算不上是真.科學家。而且科學家很多時侯甚至希望任何與自己看法相違的說法/理論是真(因為那代表有很多新研究方向可以做),就好像小弟偶像湯川學般 。所以偽科學,量子乜乜乜充斥社會這問題一切都是貝氏機率的錯!(笑)

( 圖擷取自:日劇《神探伽利略》)

有關貝氏定理怎樣與一個人的信念相關可以看以下短片(含中文字幕):

今次說到這裡,下次再談。

延伸閱讀:

[1] http://cablenews.i-cable.com/ci/videopage/program/122490332/%E6%96%B0%E8%81%9E%E5%88%BA%E9%87%9D/%E5%82%B3%E5%BF%83%E5%B8%AB%E8%81%B2%E7%A8%B1%E9%9D%A0%E7%85%A7%E7%89%87%E5%8F%AF%E7%9F%A5%E5%8B%95%E7%89%A9%E6%83%B3%E6%B3%95

[2] 想認識乜嘢係量子糾纏可以睇番小弟嘅拙文

https://godfreyleungcosmo.wordpress.com/2017/05/24/%E6%89%80%E6%9C%89%E5%98%A2%E9%83%BD%E4%BF%82%E9%87%8F%E5%AD%90%E7%B3%BB%E5%88%97-%E8%B6%85%E9%81%A0%E8%B7%9D%E9%9B%A2%E5%98%85%E9%AC%BC%E9%AD%85%E6%95%88%E6%87%89%EF%BC%9F%E6%84%9B%E5%9B%A0/

[3] https://www.idomaths.com/zh-Hant/probability5.php

[4] 有關貝氏機率嘅online course (英文)

https://www.coursera.org/learn/bayesian-statistics

文章開頭機率問題答案︰

1) 答案是 1/3 。兩個小朋友的性別組合有男男、男女、女男、女女,各組合機率同樣是 1/4 。由於已知最少其中一個是女孩,所以只剩男女、女男、女女三個可能性。結論另一個小朋友都是女孩機率是 1/3 (註:男女≠女男)

2) 答案是 1/2 。雖然與上題一樣是知道其中一個小朋友是女孩,但看到那位小朋友會令情況不同。如果假設幫手開門的小朋友是那對小朋友中隨機一位,那女孩開門可能性為男女*、女*男、女*女、女女*,這裡*為開門者。所以另一個小朋友都是女孩可能性是 1/2 。其實在這條題目中「知道開門的是女孩」這訊息跟問題「另一位小朋友性別是甚麼」是沒有關係的喔!

PS︰其實這兩條問題某程度上有一定「爭議性」,因為答案結論與前設,如何接收到「其中一個是女孩」這訊息有關。不過這也正好導出前設、貝氏機率的重要性。

廣東話原文link:

https://godfreyleungcosmo.wordpress.com/2017/07/19/%e8%b2%9d%e6%b0%8f%e6%a9%9f%e7%8e%87%ef%bc%8c%e5%81%bd%e7%a7%91%e5%ad%b8%e5%85%85%e6%96%a5%e7%a4%be%e6%9c%83%e5%98%85%e5%8e%9f%e5%9b%a0%ef%bc%9fbayesian-statistics-the-reason-why-pseudoscience-preva/

--

--

Godfrey Leung

土生土長香港人,有幸在劍橋待過,閒時研究物理,憂心香港未來的「業餘足球員」,曾夢想成為另一個湯川教授。 劍橋大學數學系碩士、諾定咸大學博士,曾為APCTP博士後研究員,主修宇宙學。 現為data scientist www.facebook.com/godfreyleung.cosmo