丁守中的大數據?我讀「小數據騙局」| 傑哥補藥 EP5

陳思傑 Jesse Chen
社群丼玩行銷
Published in
8 min readAug 17, 2018

--

本文文長約 2,400 字,閱讀時間約 5 min。這篇主要會從丁守中說單身、獨居者是社會不定時炸彈這個新聞,談《小數據騙局》這本書。這篇也有搭配音頻噢!【傑哥補藥】音頻連結請點這裡:http://pcse.pw/9YFCC

大家都知道這個新聞吧?丁守中 13日在婦幼安全記者會上指出,根據「大數據分析」,社會上挫敗的人,屬於男性、無婚姻、獨居、失業,缺乏親密友人等特質,是社會不定時炸彈。這個言論引起各方的激烈討論,丁守中雖然說這是衛福部的資料、是事實,但最後也鄭重道歉了。

首先我要講一下,這不叫大數據!這就是單純的統計而已。而雖然我不是統計專業,但行銷跟數據、統計是密不可分的,所以今天我就想要藉著這個新聞來聊聊「小數據騙局」這本書。作者是小林直樹、由時報出版社在今年四月出版,所以算是滿新的書。這本由記者所撰寫的「小數據騙局」,就是在告訴你:新聞媒體怎麼用數據來說謊?如果你是工作上需要接觸到數據的行銷人、社群工作者,我相當推薦可以讀一下。

我想從 3 個部分來談談這本書:

  1. 小數據怎麼騙過你的眼睛?
  2. 怎麼讀「小數據騙局」這本書?
  3. 「數據識讀」能力為什麼重要?

小數據是怎麼騙過你的眼睛?

我們常常看到很扯的新聞時,第一個反應是「我才不相信咧,附上數據佐證啊!」但有時候附上數據,反而會讓我們落入小數據的圈套中。怎麼說呢?我想直接舉書中的兩個新聞案例,這樣大家比較好理解:

1. 安於現狀、沉迷網路,日本的年輕人都不愛出國了嗎?依據日本法務省「出入國管理統計」的資料,20多歲年輕人的出國人數從 1996 年的 463萬人一路下滑,到了 2015 年只剩下 253 萬人。而看比例的話,從 90 年代 20多歲年輕人佔了總出國人數的 27% ~ 28%,到了現在卻只剩下 15%。

所以日本一些媒體就說了:年輕人可能是因為安於現狀、沉迷於智慧型手機,所以對出國開拓視野都沒有興趣了,甚至擔憂日本年輕人這樣是心靈上的鎖國。

那麼真相是什麼呢?難道年輕人真的不愛出國了嗎?不是的,會有這樣的數據,其實跟 70 年代前期的第二次嬰兒潮,以及 90 年代的少子化有非常大的關聯。

1996 年為什麼 20 多歲年輕人出國人數多?是因為他們是在 1970 年代嬰兒潮出生的,是相對人數最多的。 而 2015 年 20 多歲的年輕人是在少子化的 1990 年代出生,相對這個世代的年輕人人數就少了,當然出國的人數數字就會比較少。

那要怎麼判斷年輕人是不是真的對出國冷感?並不是要算「20 多歲出國人數占總出國人數的比例」,而是應該計算「在不同年代中,20 多歲出國人數佔總 20 多歲人口的比例」,這樣一計算就會發現,1996 年年輕人有 24% 出國、2015 年則是 20%,其實相去不遠。反而是現在喊著「我們年輕的時候才不會像你們一樣」的中老年人,他們在 1980 年代還是 20 幾歲的時候,出國比例反而超低的,完全打臉啊。

2. 住得越高,有流產經驗的女性比例越高?想生小孩就要避開高樓層嗎?根據日本臨床環境醫學會的數據,33歲以上女性有流產經驗的比例,依照居住樓層有很大的不同。5 樓以下是 22% 左右,到了 10 樓以上這個比例躍升到 66.7%。

那這樣是不是我想生小孩的話,不要去住高樓層?聽起來雖然很不合理,可是數據就是這樣顯示的呀?那麼真相是什麼呢?

原因其實很有可能來自於「不同樓層的價格」。由於日本樓層越高、房價通常越高,所以高樓層往往是高年收入的雙薪家庭。也就是說住高樓層的女性有較高的比例是工作壓力大、職位高的女強人,而不少女強人也是年齡較高時才選擇懷孕,流產的比率就相對提升了。

數據有相關關係,並不表示有因果關係。

同樣的,這次丁守中的大數據事件,就算「單身族群」和「高犯罪危險族群」是在數據上相關性較高,但並不表示這兩個數據之間有「因果關係」。不然依據數據,男性犯罪率較高,是不是要監控所有男性?異性戀的性犯罪機率較高,是不是要監控所有異性戀?如果我們真的想要解決這樣的社會安全問題,就必須深入探究造成這些社會事件背後的真正原因。

怎麼看「小數據騙局」這本書?

這本書以非常完整的架構,用 8 個章節去討論 8 種可能讓你被誤導的數據類型。

「小數據騙局」每個篇章都會先提出一個搭配數據的新聞或是事件,乍看之下資料都有了,應該沒有任何破綻。但接下來它就會帶著你反思:真的是這樣嗎?會不會因為忽略了什麼,而讓我們錯誤解讀了這些數據呢?我覺得最有意思的是,如果我直接跟你講結論:「要確認前後數據的母體是否有變化」或是「一定要考慮到跟過去數據的比較」你肯定會覺得:這不是廢話嗎?我當然知道要注意這些。但當真實的案例擺在你眼前時,真的很有可能你是看不出破綻的。

我自己是數據狂,是一個看到報表會呼呼呼好興奮的人。所以在看這本書的時候,我看前面的案例一定會先自己想想看,試著推敲一下這個數據可能在哪裡出了問題?然後再繼續看下去,看看自己的推理對不對,猜中的時候就會忍不住在心裡吶喊「哼哼哼…我果然好聰明啊」,每一次的數據翻案,都讓我看得相當過癮,不知不覺一兩個晚上就可以看完了。

如果你平常工作、或是學習中較少接觸數據和統計的人,或許每個案例你需要花多一點時間咀嚼、反覆思考,但這本書的寫法相當淺顯易懂,案例通常跟台灣會看到的新聞相當類似,非常貼近生活,所以不至於有對數學不拿手就看不懂這本書的可能性。如果是才剛開始想要接觸數據分析的朋友,我想這也會是一本可以輕鬆入口消化的書。

「數據識讀」能力為什麼重要?

我們常常在說每個人都應該要有「媒體識讀」,要能夠分辨新聞的真偽和優劣。但我覺得「數據識讀」會是一個非常重要的基礎,因為唯有「能正確的解讀出數字中的意義」,你才能更接近事情的真相。尤其如果你是一個行銷或是社群工作者,建議在日常生活中看到任何數據,都要訓練自己多想一下,去培養自己對數字的敏感度,這會是很好的習慣。

比方說,我看到今天賴清德公布從明年1月1日起,每個月的基本工資將由目前的 22,000,調漲為 23,100元,調幅達到 5%。結果下面一堆網友留言「太沒誠意了!怎麼不漲到之前說的平均薪資 4萬8 呢?」我真的很想講:你們傻了啊?如果最低薪資漲到 4萬8,平均薪資就不會是 4萬8 了啊?這種基本的統計常識,其實仍然有滿多人搞不懂的。

不管你是從事什麼樣的工作,都不要甘於做個數字文盲。

抓出數據只是第一步,從數字中看出事情的脈絡,才能不會掉入「小數據騙局」的陷阱。

最後整理一下今天的三個部分:

  1. 「小數據騙局」這本書就是在告訴你:新聞媒體怎麼用數據來說謊?如果你是工作上需要接觸到數據的行銷人、社群工作者,我會推薦給你。
  2. 「小數據騙局」總共有 8 個篇章,每個篇章都會先提出搭配數據的新聞或是事件,然後再帶著你找出數據中的破綻。
  3. 平常就要培養自己的「數據識讀」能力,學習從數字中看出事情的脈絡。

之後我也會不定期在「傑哥補藥」中,談談我讀完後想要推薦給大家的書。如果大家有行銷、社群、或是工作職場相關的書籍想要推薦我看看,歡迎直接私訊 MC 小編 傑哥的粉絲專頁,我會挑我有興趣的書來看噢!

原則上希望每週一三五的晚上11:00 可以讓大家聽到最新、最有趣的社群行銷相關分享,如果喜歡的朋友可以訂閱 MC 小編 aka 傑哥的 Chatbot 會準時發送給各位最新的音頻,也歡迎追蹤我的 Facebook 帳號:陳思傑,我會多多跟大家交流社群想法的!

- 想要看我寫社群創意相關內容的朋友,請給我10~20個 Clap。
- 想要看我寫社群數據分析相關內容的朋友,請給我20~30個 Clap。
- 如果想看我寫職涯相關內容的朋友,請給30個以上的 Clap。
想要參與更多社群討論歡迎到「社群丼」,我是只要有人社群顧問的 陳思傑 Jesse Chen
也歡迎追蹤我的 Facebook 帳號和IG:jesseuni。
聯繫只要有人社群顧問:jesse.chen@humanoid.com.tw

--

--

陳思傑 Jesse Chen
社群丼玩行銷

只要有人社群顧問執行長/ 客家小吵的吵爸/曾任臺灣吧行銷總監 。熱愛社群、熱愛行銷、有時候也熱愛畫圖,努力學習並分享一些有趣的社群想法!