[書 ] 一次看懂小數據

Published in

Mr.T • 塵思產品人

4 min readJan 22, 2018

EVERYDATA: The misinformation hidden in the little data you consume every day

你是不是對於日常新聞數據抱持懷疑？或是對各種商業雜誌的數據感到困惑？又或對於職場上你聽到的數據不知所信？如果是這樣，那這本書或許適合你繼續拿來翻翻…

原文更能表達原意

首先，每每看完一本書，總覺得標題或副標方面，還是英文原意更符合作者要表達的意涵，不是翻譯得不好，而是有時為了吸引讀者，換句話說。

這本書，如原意的標題，揭露你平常看的報章雜誌、網路新聞媒體、人與人表達、商務上表達等等，你每分每秒在接觸到這些數據時，或是你再用這些數據時，會犯的錯誤，以及要怎麼避免。

數字力，在現代很重要，尤其當個有智慧的數字觀察者，更為重要，小心落入邏輯與淺薄思考的窠臼。

翻了翻，作者使用「統計學」該有的名詞。等等…聽到「統計」，還別急著離開…這本書沒想像中的複雜，反而很有趣且引人好奇，如何用淺顯易懂的生活例子套用在深入難懂的理論實證。重點不是你該怎麼「數學或統計證明」，而是你該怎麼從數字中保持正確的判斷力。(甚至我認為現今的新聞記者都該看這本書，了解基本概念)

整本書不外乎圍繞幾個重點

批判性思考
多問為什麼

樣本選擇/抽樣數據

為什麼需要樣本？從何而來？調查對象是？可以代表母體？是否符合研究問題？抽樣無好壞之分，重點是如何解讀結果

加總、平均與離群值

平均，是一種概括性指標，暗示所有數據都是同質的，不顧差異。優勢在於考慮數據中所有數值，若樣本無法代表整個母體，而是選擇性的或其他問題，那平均就會造成誤導。

離群值，被處理的常見做法是刪除…但是否真的代表偏見

相關性與因果關係

兩個因素之間存在統計關係，不代表兩者之間存在有意義的連結。例如確認偏誤：解讀數據時常常會傾向於強化原有的意見，在找「特定的」答案

統計顯著性

樣本大小對於發現的結果是否具備統計顯著性影響極大。結果具備統計顯著性，並不代表效果很強或很弱。要注意遺漏變數、離群職、確認偏誤、選擇偏誤

錯誤表述/ 選擇性表述

檢視圖表，要看數據是屬於「累積性」還是「遞增性」

如果你想要延伸閱讀，或對機率統計有想要更近一步的興趣，推薦幾本書。主題式閱讀很重要，有助於增進你對一個知識體的理解架構，這算是我第二次嘗試這樣的學習，但不夠密集，成效未必很好，下次有機會再分享另外一個主題式閱讀。

《小數據獵人》Small Data: The Tiny Clues That Uncover Huge Trends

輕鬆的日常觀察書籍，不太是教你如何從茫茫數據海找尋小數據，更注重的是以「人」為本的觀察力，逐個觀察並串聯細節，可以發揮意想不到的功用。

《機率思考》Chancing it: The laws of chance and how they can work for you

除了生活化的簡易說明日常現象，後面越來越偏真正機率與統計的解釋，整體上還算白話的解釋，但後面建議有點概念邊查邊理解

《統計學，最強的商業武器》Statistics, literacy for the next generation

很硬的書，真的想要讀通，需要實機操作過才能貫通

我們可以當個聰明的數據使用者

如果你們也喜歡閱讀，歡迎一起分享