[note] Head First Data Analysis Ch2

Experiments

Sheng-Chuan Yen
Big Data
Published in
2 min readNov 30, 2013

--

Observational study

相對於 controlled experiments,observational study 對於研究的主題不進行指定的分組(實驗組及對照組),直接觀察整個 Group 對於某些變因產生的結果。

Confounder

假設我們想研究咖啡的銷售與經濟狀況的關係,然而從 observational study 中常常會隱藏許多的 confounders。例如地區: 市中心的咖啡銷量也許就不受經濟狀況的影響。

Deal with Cofounders

處理 cofounders 的方法就是將取得的統計資料再切成更小塊。例如依地區再細分成更細的統計結果。如此我們便能觀察不同地區對於結果的影響。

Control Group and Experimental Group

就像 Ch1 提到的,統計就是要比較。如果我們想要證明作的決策是否有效,那我們必需設計一個實驗。首先我們要作適當的分組,為了要盡可能減少 cofounders 對結果的影響,在分組時記得一定要夠 Random。書本裡的實驗針對地區再細分了更小的地點,然後隨機的將 "小地點" 分配到 Control Group 及 Experimental Group。

  • Control Group: 保留全部原有的變因,控制不作改變的組別
  • Experimental Group: 將想實驗的變因加在這個組別

心得

作 Data Analysis 的時候一定要保持一個很細微的觀察力以及處處懷疑的心態,因為在整個資料裡可能會存在著許多 confounders,若在作實驗之前沒有仔細考慮過 confounders 的影響的話,實驗的結果也會因此失去了一些關鍵的結果。

--

--

Sheng-Chuan Yen
Big Data
Editor for

Software Developer, Data Science Student, Family Photograper