透過Coronavirus (COVID-19)通俗理解中央極限定理(Central Limit Theorem)

Sharko Shen
Data Science & LeetCode for Kindergarten
3 min readApr 23, 2020

這次要用最淺顯易懂的方式講解中央極限定理。

1 .什麼是中央極限定理(Central Limit Theorem)

來源: http://homepage.ntu.edu.tw/~clhsieh/biostatistic/5/5-1.htm

上圖可以直接跳過,我只是想表示密密麻麻的文字讀起來很複雜似懂非懂。

白話文:
給定一個任意分配的母體。每次從這些母體中隨機抽取n 個樣本,一共抽m 次。然後把這m 組樣本分別求出平均值。這些平均值的分配接近常態分佈。

相信還是沒有畫面,我們來舉個時事例子

2. 通俗白話舉例

現在我們要統計全世界感染Coronavirus患者的年齡分布,看看全世界平均感染年齡是多少。

但全世界患者激增,要調查所有患者的年齡是不太實際的。

所以我們打算從全世界各地調查10000組,每組50位病患

  • 接著求出第一組病患的平均年齡

舉例: 74歲

  • 第二組的平均年齡

舉例: 65歲

  • 第三組的平均年齡

舉例: 40歲

  • 就這樣一直取到第10000組的平均年齡

舉例: 第10000組的平均年齡87歲

最後,當我們再把10000組算出來的年齡平均值加起來再取平均值
也就是 (74+65+40+…+87)/10000

結論! 這個值就會接近全世界患者的平均年齡!!!

另外這10000組平均年齡的分布會趨近於常態分佈!!!

這就是中央極限定理的神奇魔力!

註: 取樣本的時候,每組樣本一般大於等於30個,中心極限定理即可發揮作用。

--

--

Sharko Shen
Data Science & LeetCode for Kindergarten

Thinking “Data Science for Beginners” too hard for you? Check out “Data Science for Kindergarten” !