數字不會騙人?相關不等於因果!

Tony's Pensieve
Tony訓練中心
Published in
4 min readSep 10, 2019

累了嗎?聽個笑話吧(x)

實驗/笑話

為了證明青蛙(不同動物版本都有)的耳朵長在腿上,有人做了一個實驗:

實驗材料:青蛙、刀,同等分貝語音指令錄音 「」等。

實驗過程:
(1)對照組:找個青蛙,對它播放「」,實況錄像並記錄相關數據;(跳了1米)
(2)實驗組:跺掉它一隻後腿,對它播放「」,實況錄像並記錄相關數據;(遲疑了一下,跳了0.5米,有點歪)
(3)實驗組:跺掉它另一隻後腿,對它播放「」,實況錄像並記錄相關數據;(沒跳)
重複10只青蛙,測算平均跳躍距離。

結論:青蛙的聽覺器官在後腿上,並且一邊有一隻,若兩邊都失去,將無法由聽力接受指令。

我們都明白,就連三歲的小孩都知道青蛙沒了腿是不會跳的。但是退一步說,假如「需要腿才能跳」對我們來說是未知呢?又該如何正確的分析數據得出結論?

(笑話很常見,引用版本為: http://datakung.com/?p=31)

青蛙

相關 X ↔ Y

過去常聽到吃早餐有助於學童更佳的學習,但現在也有另一個說法來解釋這個數據:「吃早餐的學童處於更佳的學習環境(較好的家世等等),所以有更好的學習結果」。

發現了嗎?當兩件事有高機率會被同時觀測到的時候,僅代表兩件事有相關(correlation),產生相關有可能有幾種原因

早餐

1.偽關係(spurious effect) C → X, C → Y

早餐可能就是個偽關係,類似的還有數據顯示冰淇淋銷量最高的時候,就是溺水事故發生得最多的時候,但並非冰淇淋導致溺水,而是熱的時候冰淇淋銷售好,同時熱的時候游泳的人也多。

同樣的例子如果為了強調,冰淇淋跟溺水無直接因果,單純因為事件先後發生而被誤會,也會稱呼這種誤會為 coincidental correlation,青蛙的例子反過來就是-弄壞青蛙的聽力後命令青蛙跳,青蛙不為所動,得出青蛙的聽力影響跳躍能力的謬誤,實際上是因為青蛙聽不到聲音,單純的同時先後發生,並不代表因果。

中介(Mediator)

注意一下這兩種情況的區別X← C Y與X → C →Y,這兩種情況中移除C都會導致X與Y不相關,但第一種情況為偽關係,C可能是上例中的,移除熱後導致冰淇淋溺水無關;但第二種情況的例子為:減肥的意志→減肥的知識→減肥的結果,生活中普遍認同在這種情況下可以說減肥的意志將收穫減肥的結果,但如果移除了減肥的知識也會導致兩者呈現不相關。

冰淇淋

2. 因果倒置(Reverse Causality) Y→ X

大部分坐輪椅的人都出過車禍?出過車禍導致他們坐輪椅!
盲人的聽力比明眼人好,可見聽力好的人容易失明?或許是盲人由於依聽力過活,聽力開發後變得比一般人更敏銳!

相關不等於因果(correlation does not imply causation) X→ Y 不等於 X ↔ Y

相關不等於因果, 類似的例子生活中比比皆是,小孩交了壞朋友所以學業成績不佳?還是小孩學業成績不佳所以交了壞朋友?還是小孩無心學習所以交了壞朋友跟學業成績不佳?真的因果,除了相關以外應該還要有三個條件

1.X發生在Y之前
2.若X不發生則Y也不發生
3.若X發生則Y一定發生

忽視了足夠完整的論述以及實驗的變因控制,僅僅只是數據不見得能得出正確的結果,數字不會騙人?數字本身沒有意義!而解讀數字的人會騙人。

數據

— — — — -

辛普森悖論

倖存者偏差(survivorship bias)

--

--

Tony's Pensieve
Tony訓練中心

一位開發者、學習者、分享者。 喜歡與人交流互動也喜歡學習,在成為一個更好的人的路上。 我願意學,也願意教