Sitemap

Member-only story

偽學術台︰數據有問題都分幾種嘅,唔一定關統計事

kayue
Sep 27, 2019

唔知咩事可以睇咗呢篇先︰

話說陳婉容​貼咗張cap圖(但因為佢費事污染自己個page而限時刪文,我都唔貼了),有人批評佢係 「識stat曬命」,嗰位仁兄仲學咗雲吞博士個講法,將件事講成係點詮釋統計數據嘅問題,覺得陳婉容唔應該「開大喇叭唱通街連日追殺」(嗰個其實係我)。

好不幸,我唔識stat都可以講得出雲吞博士(aka 潘永堅博士)錯乜,咁我唯有簡單解釋下。講明先,好基本㗎咋,學術界朋友咪笑我,笑雲吞博士好了。至於寫嚟有乜用?佢會唔會認錯?無用㗎,咁唔通警察亂咁打人唔使理咩,記錄呢家嘢,留低遲下實有用嘅。(同埋呢排咁忙,咪當畀我發洩下囉。)

整理咗個時間線,放喺最底(下文提到嘅文都可以去時間線搵返),有需要可以去望一望先。

由「唔同數據」到「用錯數據」

今次雲吞博士嘅問題最少涉及三個方面︰

一,唔同數據,得出唔同結果;
二,數據本身有錯;
三,作者用錯數據。

我用例子答你。

雲吞博士發文當日,朱孝文陳婉容用「2019香港自殺資料統計」(佢哋9月初有搵過相關資料而見到,亦問咗負責整理嘅人點收集資料,覺得可靠)再次分析,得出相反結論。呢個就係上面嘅第一點。當時陳婉容無話雲吞博士錯(完全稱唔上咩「追殺」),只係畀大家比較下,亦提出關於自殺率變動可以考慮其他方面,同埋數據本身無辦法話畀我哋知有無「被自殺」。

同一晚,科豆話我知雲吞博士用啲資料有錯,佢第二日出嘅文章亦指出雲吞博士關於6月自殺資料嘅錯。我喺當日(18號)對晒雲吞博士108項資料,發現17項有錯。呢樣係第二點。

與此同時,我發現雲吞博士份資料有部分註明無死到或工業意外嘅個案,都俾雲吞博士當成自殺死亡個案去計數。另外佢話資料包括615太古廣場離世嘅梁先生,但實際上無。令人懷疑佢其實無仔細睇過份資料就寫文。呢個係第三點。

問題越挖越多

如果只係得第一點,用唔同數據得出唔同結果,咁咪首先唔好咬定邊個啱邊個錯先,睇下雙方分析有無問題、數據有咩差異囉。可能係收集方法有別,又可能大家都啱一半呢super,越問落去越知得多,但唔好一口咬定先 — — 即係,雲吞博士本身都唔應該寫到咁實牙實齒。

--

--

kayue
kayue

Written by kayue

Factcheck Lab 執行編輯

Responses (1)