因果效應

Raven
隨筆趣事
Published in
5 min readMay 1, 2023
Photo by Louis Reed on Unsplash

平均因果效應 (ATE)、條件平均因果效應 (CATE)、對受測組的平均應果效應 (ATT) 和對控制組的平均因果效果 (ATC),是因果推論分析的常用概念。 理解這些概念對於正確解釋因果推理結果至關重要。

在本文中,我們將討論 ATE、CATE、ATT 和 ATC 的定義和計算方式。

Average Treatment Effect (ATE)

Conditional Average Treatment Effect (CATE)

Average Treatment Effect on the Treated (ATT)

Average Treatment Effect on the Control (ATC)

範例數據

我們將使用一個簡化的數據集來說明 ATE、CATE、ATT 和 ATC 的計算方式。

在這個模擬數據集中,有四個人得了流感。 他們中的一些人接受了醫生的治療,而另一些人則沒有。 該數據集包含患者的姓名、性別、治療指標以及患者在接受治療和未接受治療恢復的天數(自然恢復)。

Dataset for ATE, CATE, ATT, and ATC

反事實

在計算ATE、CATE、ATT、ATC之前,我們需要了解什麼是反事實。

反事實意味著沒有發生但可能發生的事情。

例如,在上圖流感治療數據集中,小名接受了醫生的治療並在 10 天內康復。 我們不知道小明沒有得到治療的反事實結果,因為它沒有發生。反事實值通常使用變量(covariates)進行估計。在流感治療數據集中,小明自然恢復的 11 天時間是估計值。同樣地,小黃的接受治療後恢復時間為 8 天,小美的自然恢復時間為 12 天,小珠的接受治療後恢復時間為 7 天。

平均因果效應(ATE)

平均因果效果 (ATE) 是對人群中每個人的預期治療影響。 我們可以先得到人群中每個人的治療效果,然後通過取所有個體治療效果的平均值來計算平均因果效果(ATE)。

個體因果效應(ITE)是通過計算接受治療因果效應未接受治療的因果效應之間的來計算的。

Dataset for ITE

取所有個體因果效應的平均值 (-1+1–7–1) / 4,得出 -2,這意味著平均而言,該治療使人群的恢復時間縮短了 2 天。

條件平均因果效應 (CATE)

條件平均因果效應 (CATE) 是滿足特定條件的人口子集的平均因果效應 (ATE)。

男性的條件平均因果效應 (CATE) 僅在計算男性。我們在數據集中有兩個男性,小明和 小黃,他們的平均因果效應是 (-1+1) / 2 = 0。 因此,男性的條件平均因果效應 (CATE) 為 0,這意味著平均而言,治療對男性沒有任何影響。

同樣,女性的條件平均因果效應 (CATE) 僅在計算女性。我們在數據集中有兩名女性,小美和 小珠,她們的平均因果效應是 (-7–1) / 2 = -4。 因此,女性的條件平均因果效應 (CATE) 為 -4,這意味著該治療平均將女性的恢復時間縮短了 4 天。

從結果可以看出,流感的治療對女性有效,對男性無效。 條件平均因果效應 (CATE) 幫助我們找到人口子集之間的異質性。

對受測組的平均應果效應 (ATT)

對受測組的平均應果效應 (ATT)是條件平均治療效果 (CATE) 的特例,其中子集是治療組

對受測組的平均應果效應 (ATT)僅包括接受治療的個體小明和小美,他們的平均治療效果為 (-1–7) / 2 = -4。因此,這意味著治療組的恢復時間平均減少了 4 天。

對控制組的平均因果效果 (ATC)

同樣地,對控制組的平均因果效果 (ATC) 是條件平均因果效應 (CATE) 的特例,其中子集是控制組

對控制組的平均因果效果 (ATC)僅包括未接受治療的個體 小黃和小珠,他們的平均治療效果為 (1–1) / 2 = 0。因此,這意味著平均而言,治療對控制組沒有任何影響。

結論

在本文章中,筆者透過簡單自製的流感數據集,向讀者們介紹何謂均因果效應 (ATE)、條件平均因果效應 (CATE)、對受測組的平均應果效應 (ATT) 和對控制組的平均因果效果 (ATC)。

--

--

Raven
隨筆趣事

熱愛寫code,平時遇到有趣的事情,也會上來寫寫,抒發自己的心情。