[書 ] 一次看懂小數據
EVERYDATA: The misinformation hidden in the little data you consume every day
你是不是對於日常新聞數據抱持懷疑?或是對各種商業雜誌的數據感到困惑?又或對於職場上你聽到的數據不知所信?如果是這樣,那這本書或許適合你繼續拿來翻翻…
原文更能表達原意
首先,每每看完一本書,總覺得標題或副標方面,還是英文原意更符合作者要表達的意涵,不是翻譯得不好,而是有時為了吸引讀者,換句話說。
這本書,如原意的標題,揭露你平常看的報章雜誌、網路新聞媒體、人與人表達、商務上表達等等,你每分每秒在接觸到這些數據時,或是你再用這些數據時,會犯的錯誤,以及要怎麼避免。
數字力,在現代很重要,尤其當個有智慧的數字觀察者,更為重要,小心落入邏輯與淺薄思考的窠臼。
翻了翻,作者使用「統計學」該有的名詞。等等…聽到「統計」,還別急著離開…這本書沒想像中的複雜,反而很有趣且引人好奇,如何用淺顯易懂的生活例子套用在深入難懂的理論實證。重點不是你該怎麼「數學或統計證明」,而是你該怎麼從數字中保持正確的判斷力。(甚至我認為現今的新聞記者都該看這本書,了解基本概念)
整本書不外乎圍繞幾個重點
- WHEN & HOW 我們該質疑數據? ➡︎ 要找到真相必須付出時間與精力,但你可以先保持「批判性思考」的能力
- WHERE 資料來源於何處?原始數據是多少? ➡︎ 資料的可信程度與真實數字轉換成你現在看到的內容,有什麼不一樣,又有哪些是沒說出來
- 這些數據如何影響我的生活? ➡︎ 身為「日常小數據」使用者,你該癥結的點必然根統計學家、理論學派的必然不同
批判性思考
多問為什麼
誰適合看這本書
- 適合對機率統計毫無概念的
- 想知道日常數據怎麼影響我們生活
重點摘要
樣本選擇/抽樣數據
為什麼需要樣本?從何而來?調查對象是?可以代表母體?是否符合研究問題?抽樣無好壞之分,重點是如何解讀結果
加總、平均與離群值
平均,是一種概括性指標,暗示所有數據都是同質的,不顧差異。 優勢在於考慮數據中所有數值,若樣本無法代表整個母體,而是選擇性的或其他問題,那平均就會造成誤導。
離群值,被處理的常見做法是刪除…但是否真的代表偏見
相關性與因果關係
兩個因素之間存在統計關係,不代表兩者之間存在有意義的連結。例如確認偏誤:解讀數據時常常會傾向於強化原有的意見,在找「特定的」答案
統計顯著性
樣本大小對於發現的結果是否具備統計顯著性影響極大。結果具備統計顯著性,並不代表效果很強或很弱。要注意遺漏變數、離群職、確認偏誤、選擇偏誤
錯誤表述/ 選擇性表述
檢視圖表,要看數據是屬於「累積性」還是「遞增性」
延伸閱讀
如果你想要延伸閱讀,或對機率統計有想要更近一步的興趣,推薦幾本書。主題式閱讀很重要,有助於增進你對一個知識體的理解架構,這算是我第二次嘗試這樣的學習,但不夠密集,成效未必很好,下次有機會再分享另外一個主題式閱讀。
《小數據獵人》Small Data: The Tiny Clues That Uncover Huge Trends
輕鬆的日常觀察書籍,不太是教你如何從茫茫數據海找尋小數據,更注重的是以「人」為本的觀察力,逐個觀察並串聯細節,可以發揮意想不到的功用。
《機率思考》Chancing it: The laws of chance and how they can work for you
除了生活化的簡易說明日常現象,後面越來越偏真正機率與統計的解釋,整體上還算白話的解釋,但後面建議有點概念邊查邊理解
《統計學,最強的商業武器》Statistics, literacy for the next generation
很硬的書,真的想要讀通,需要實機操作過才能貫通
我們可以當個聰明的數據使用者
如果你們也喜歡閱讀,歡迎一起分享