[書 ] 一次看懂小數據

Mr.T
Mr.T • 塵思產品人
4 min readJan 22, 2018

EVERYDATA: The misinformation hidden in the little data you consume every day

你是不是對於日常新聞數據抱持懷疑?或是對各種商業雜誌的數據感到困惑?又或對於職場上你聽到的數據不知所信?如果是這樣,那這本書或許適合你繼續拿來翻翻…

原文更能表達原意

首先,每每看完一本書,總覺得標題或副標方面,還是英文原意更符合作者要表達的意涵,不是翻譯得不好,而是有時為了吸引讀者,換句話說。

這本書,如原意的標題,揭露你平常看的報章雜誌、網路新聞媒體、人與人表達、商務上表達等等,你每分每秒在接觸到這些數據時,或是你再用這些數據時,會犯的錯誤,以及要怎麼避免。

數字力,在現代很重要,尤其當個有智慧的數字觀察者,更為重要,小心落入邏輯與淺薄思考的窠臼。

翻了翻,作者使用「統計學」該有的名詞。等等…聽到「統計」,還別急著離開…這本書沒想像中的複雜,反而很有趣且引人好奇,如何用淺顯易懂的生活例子套用在深入難懂的理論實證。重點不是你該怎麼「數學或統計證明」,而是你該怎麼從數字中保持正確的判斷力。(甚至我認為現今的新聞記者都該看這本書,了解基本概念)

整本書不外乎圍繞幾個重點

  1. WHEN & HOW 我們該質疑數據? ➡︎ 要找到真相必須付出時間與精力,但你可以先保持「批判性思考」的能力
  2. WHERE 資料來源於何處?原始數據是多少? ➡︎ 資料的可信程度與真實數字轉換成你現在看到的內容,有什麼不一樣,又有哪些是沒說出來
  3. 這些數據如何影響我的生活? ➡︎ 身為「日常小數據」使用者,你該癥結的點必然根統計學家、理論學派的必然不同

批判性思考

多問為什麼

誰適合看這本書

  • 適合對機率統計毫無概念的
  • 想知道日常數據怎麼影響我們生活

重點摘要

樣本選擇/抽樣數據

為什麼需要樣本?從何而來?調查對象是?可以代表母體?是否符合研究問題?抽樣無好壞之分,重點是如何解讀結果

加總、平均與離群值

平均,是一種概括性指標,暗示所有數據都是同質的,不顧差異。 優勢在於考慮數據中所有數值,若樣本無法代表整個母體,而是選擇性的或其他問題,那平均就會造成誤導。

離群值,被處理的常見做法是刪除…但是否真的代表偏見

相關性與因果關係

兩個因素之間存在統計關係,不代表兩者之間存在有意義的連結。例如確認偏誤:解讀數據時常常會傾向於強化原有的意見,在找「特定的」答案

統計顯著性

樣本大小對於發現的結果是否具備統計顯著性影響極大。結果具備統計顯著性,並不代表效果很強或很弱。要注意遺漏變數、離群職、確認偏誤、選擇偏誤

錯誤表述/ 選擇性表述

檢視圖表,要看數據是屬於「累積性」還是「遞增性」

延伸閱讀

如果你想要延伸閱讀,或對機率統計有想要更近一步的興趣,推薦幾本書。主題式閱讀很重要,有助於增進你對一個知識體的理解架構,這算是我第二次嘗試這樣的學習,但不夠密集,成效未必很好,下次有機會再分享另外一個主題式閱讀。

小數據獵人》Small Data: The Tiny Clues That Uncover Huge Trends

輕鬆的日常觀察書籍,不太是教你如何從茫茫數據海找尋小數據,更注重的是以「人」為本的觀察力,逐個觀察並串聯細節,可以發揮意想不到的功用。

機率思考》Chancing it: The laws of chance and how they can work for you

除了生活化的簡易說明日常現象,後面越來越偏真正機率與統計的解釋,整體上還算白話的解釋,但後面建議有點概念邊查邊理解

統計學,最強的商業武器》Statistics, literacy for the next generation

很硬的書,真的想要讀通,需要實機操作過才能貫通

我們可以當個聰明的數據使用者

如果你們也喜歡閱讀,歡迎一起分享

--

--

Mr.T
Mr.T • 塵思產品人

Someone who loves technology, design, business trend. To be a well-rounded person. Mail: tianchen.tw@gmail.com