【統計 — 2】點估計、抽樣分佈、信賴區間和假設檢定

Published in

Becoming a data scientist

5 min readSep 3, 2022

首先，先來看一題是非題：

給定一個母體（population）和一個固定的樣本大小 n，只會有一種點估計的抽樣分佈。

答案：是。

為什麼呢？

樣本數 n 越大，抽樣分佈則會越窄，且對於大部分的點估計（平均數、中位數和變異數），抽樣分佈都會越接近鐘型曲線。

如果我們已知抽樣分佈（sampling distribution），即可推得母體參數（population parameter）。

但是現在的問題就是，我們不知道母體，因此無法抽樣，進而無法獲得抽樣分佈。

在現實世界中，我們不可能重複抽取 1000 次大小為 n 的樣本，我們只能抽樣一次（a single representative sample），且希望此次能夠抽樣越大越好。所以，我們需要方法來估計 sampling distribution

解法：使用 bootstrap sampling。

什麼是 bootstrap 呢？讓我們來介紹步驟。

現實生活中我們只會有一組樣本（大小為 n），如果反覆在這組樣本中抽出大小為 n 的集合，且取後放回，並計算每一個集合的點估計值（point estimate），則可以得到抽樣分佈的估計，稱之為 bootstrap distribution。

以下表格比較 bootstrap distribution 和抽樣分佈（sampling distribution）的差異：

我們使用 bootstrap sampling 的目的並非獲得點估計，因為如果想要估計的話，直接從樣本計算即可，我們的目的是要估計抽樣分佈本身。

值得注意的是，bootstrap distribution 的中心可能不會和抽樣分佈的中心相同，但是形狀和分佈會很接近，意即 bootstrap distribution 帶給我們很好的標準誤（standard error）估計。

信賴區間

我們無法確定信賴區間是否包含母體參數，因為我們永遠都不知道真實的母體參數值。我們只能說在95% 的信心水準下，95% 的信賴區間會包含真正的母體參數值。

對於信賴區間常見的錯誤說法：95% 的信賴區間代表有 95% 的機率會包含母體參數值。

這句話是錯的！因為信賴區間包含母體參數值的機率有只可能是 0 或 1。

信賴區間的寬度被

(1) 信心水準的影響：越有信心，信賴水準越高，則信賴區間會越寬

(2) 樣本大小的影響：越大的樣本大小會產生越窄的信賴區間，且標準誤也會隨之降低

做假說檢定的目的不是試著去找真實的母體參數值，而是要確認是否有足夠的證據證明樣本違反假說檢定。

做假說檢定需要的元素：

the p-value

在 null distribution 看到這個資料（what we observed in the real world）的機率， say if p = 0.01，代表在 null distribution 看到這個機率很小，所以可以推翻虛無假設（因為在 null distribution 發生的機率太小了，但我們在現實中觀察到了，所以代表虛無假設是錯的）
significance level：用來設定那個 cutoff，到底要發生的機率多小，我們才會說這個存在在 null distribution 的機率太小，而拒絕 H0

Type I Error（α）

Type II Error（β）

Power（1-β）

兩個可能會影響 type 2 error 的事情：

the effect size：真實母體參數值和在虛無假設中假設的數值
樣本大小（the sample size）：當樣本數 n 變大，會讓抽樣分佈變窄，進而讓 null hypothesis 和抽樣分佈（sampling distribution）的重疊變小

想要更深入了解的話，別忘了去最上面的目錄看其他章的課程筆記！

喜歡這篇文章或是對你有幫助的話，別忘了拍手給我鼓勵哦 👏🏻