실무 인과추론 Toolkit : 도구변수 (Instrumental Variables) 2

Bonnie BK
BON DATA
Published in
10 min readDec 5, 2021

LATE (Local Average Treatment Effect)

시리즈

인과추론을 위한 도구변수 시리즈는 3가지 목차로 나누어 진행됩니다.

(1) 도구변수 개념 제대로 뽀개기
(2) LATE (Local Average Treatment Effect) 💡 이번 목차 💡
(3) 연구 사례와 실무 활용 포인트

목차

1. Compliers and Non-compliers
2. LATE (Local Average Treatment Effect)
개념 | 가정
3. Generalizing LATE

출처 자료

강의 4개를 요약하고, 2개의 테크 블로그를 참고하였습니다.

Compliers and Non-compliers

실험 대상자에 대한 분류를 Treatment 그룹으로의 할당 여부(A), 그리고 실험 대상자들이 순응하여 Treatment가 적용되는지 여부(T)에 따라 2x2 Matrix로 구성할 수 있는데요.

Matrix 출처
도구변수는 강제성을 부여하지 않아서, 모든 샘플에 대해서 도구변수에 따라 일관되게 Treatment 가 정해지지 않을 것입니다.

Matrix에 따라 크게는 2가지, 세부적으로는 4가지로 실험 대상자를 분류해볼 수 있습니다.

[1] Compliers

  • Compliers : Assignment에 맞게 순응하는 사람들.
    ✔ Treatment 그룹에 할당되면 Treatment 를 받고, Control 그룹에 할당되면 Treatment 를 받지 않는 그룹.
    ✔ 연구대상자들이 말을 잘 들어 Treatment Assignment 및 도구변수에 따라서만 Treatment 여부가 결정되는 그룹.

[2] Non-compliers (Angrist, Imbens, and Rubin 1996)

  • Always takers : Assignment와 별개로 항상 Treatment 를 받는 사람들
  • Never takers : Assignment와 별개로 항상 Treatment 를 안 받는 사람들
  • Defier : Assignment와 오히려 반대로 움직이는 사람들 (청개구리)

Non-compliance가 발생할 수 있는 예시는 이전 글에서 보실 수 있습니다.
(분류 출처)

LATE (Local Average Treatment Effect)

개념

위에서 살펴본 4가지의 Compliance 종류에서, Compliers 그룹에서 도구변수를 사용해 추정한다면, 인과 효과가 Compliers 그룹에만 적용되는 효과로 한정이 됩니다.

이처럼, Compliers 그룹에 대해서만 추정하는 Average Treatment Effect를 LATE (Local Average Treatment Effect)라고 합니다. 또한 LATE (Local Average Treatment Effect)는 Complier Average Causal Effect (CACE)로 불리기도 합니다.

The LATE is the average treatment effect among a specific subset of the subjects, who in this case would be the compliers.

LATE는 (1) 도구변수 estimator 를 활용하거나 (2) ITT effect 와 예상되는 Complier 그룹의 비율을 활용해서 추정될 수 있습니다. 이번 글과 다음 글에서는 (1) 방법론에 포커스를 맞추어 작성합니다.

가정

특히, LATE를 추정하기 위해서 필요한 Assumption들이 존재하는데요. 먼저, Non-compliance 프레임워크에 따라 2가지로 구분이 되고, 각기 필요한 가정도 다르게 정의됩니다.

✔ Non-compliance Framework

[1] One-sided non-compliance
Compliers, Never takers 로 2가지로만 분류 가능

Assumptions
- Stable Unit Treatment Value Assumption (SUTVA) : Non-interference
- Excludability Assumption

[2] Two-sided non-compliance
Compliers, Never takers, Always takers, Defiers로 4가지로 분류 가능

Assumptions
- Stable Unit Treatment Value Assumption (SUTVA) : Non-interference
- Excludability Assumption
- Monotonicity Assumption

✔ 3 Assumptions

[A] Stable Unit Treatment Value Assumption (SUTVA) : Non-interference

SUTVA 가정은 아래 2가지 항목으로 구성되는데, 이 중에서 Non-interference 가정을 만족할 것을 이야기합니다.

  • Non-interference : 특정 실험 대상자의 Potential Outcome은 다른 실험 대상자의 Treatment 적용에 의해 영향을 받지 않는다.
  • Consistency : 개별 실험 대상자에 가해지는 모든 Treatment는 일관된 Potential Outcomes 를 이끈다. Treatment 의 Level 이 다른 형태나 버전을 가질 수 없다. (출처 : Applied Causal Analysis)

[B] Excludability Assumption

  • Randomization은 Treatment가 아닌 다른 변수를 통해서 결과변수에 영향을 줄 수 없다. (Angrist and Pischke 2009, 116)

[C] Monotonicity Assumption

Generalizing LATE

Two-sided non-compliance 의 경우:

LATE는 전체 샘플에 대한 Average Treatment Effect가 아닌, Defiers 그룹을 제외한 샘플에 대한 Average Treatment Effect를 추정하는 방식입니다. 따라서 경우에 따라 서로 다른 도구 변수는, 다른 인과 추정 결과를 보일 것이라는 우려점도 있어요. (10 Things to know about LATE)

LATE는 Compliers 그룹 에만 적용되는 효과이지만, 비즈니스는 물론 연구자들의 관심은 주로 더 넓은 대상자들에게 적용되는 인과 효과를 측정하고 싶다는 것이 문제인데요. 따라서 LATE 추정치를 전체 샘플에 적용될 수 있는 추정치로 일반화할 수 있는 상황들을 소개합니다.

세션에서 소개된 바에 따라 아래 3가지 각 상황일 때 LATE를 일반화할 수 있게 됩니다.

[1] No Always Takers

  • Defiers 가 없는 것은 기본적인 Monotonicity Assumption입니다.
  • 이 경우, ATE = Always takers + Compliers 의 효과로 구성이 됩니다.
  • 이 수식에서 Always taker 가 없어진다면? ATE = Compliers로 계산할 수 있습니다.
  • 즉, Compliers 에 한정된 효과를 추정하더라도 ATE와 같아집니다.
  • 이 경우, LATE는 ATT와 같아지며, LATE가 ATE와도 같아지기 위해서는 No Never Takers 조건까지 만족해야 합니다. 만족시키기에 난이도가 높은 가정입니다.

[2] Homogeneity assumption

  • Compliers, Always Takers, Never Takers, Defiers 의 서로 다른 그룹들에 도구변수가 주어지면, 도구변수에 대해서 Treatment를 받을지 말지에 대한 Reaction 이 그룹 내부에서는 동일한 Potential Outcomes으로 나와야 합니다.
  • 이 때, 서로 다른 그룹들 전체에서, 도구변수에 대한 Reaction만 다르고 다른 부분은 전부 유사하다면 LATE(도구변수를 통해서 Treatment 를 받은 Compliers의 인과적 효과)와 ATE는 유사해진다는 가정입니다.
  • (비교) 이와 다르게, SUTVA 에서의 Consistency 가정은, 도구변수 및 랜덤실험을 통해서 받은 Treatment가 Consistent 해서 누구나 같은 Treatment 를 받으면, 항상 같은 Potential Outcomes 가 나와야 한다는 의미입니다.

[3] Randomness of IVs (Golden Standard)

  • 도구변수가 만약 원인변수를 예측할 때, Random하게 예측한다고 하면, 이 Randomly 예측된 부분의 효과는 전체의 인과적인 효과와 평균적으로 유사할 수 있습니다. 예측된 부분 자체가 Random하게 선택되었을테니까요.
  • 사회과학 연구에서 도구 변수 대부분의 경우는 Randomness가 포함되지 않습니다. 하지만 온라인 및 모바일 앱 환경에서는 비교적 설계가 수월합니다.
  • Randomness가 포함된 도구 변수는 아주 유리합니다. LATE를 가장 알고자 하는 ATE로 일반화할 수 있으며, 도구변수의 Identification Assumptions 2가지도 만족합니다.
  • 예시로 이전 글에서 작성했던 Non-compliance 에서 Randomness가 포함된 도구변수를 정의해봅시다.
[예시]
1. 푸시를 보낸 그룹 (실험군) VS 푸시를 안 보낸 그룹 (대조군)
BUT 푸시를 받은 여부와 별개로, 유저가 직접 푸시를 클릭할지 여부를 선택할 수 있는 형태.
✔ 도구변수 : 푸시를 Randomly Assigned 50%:50% 로 보낼 경우 그 여부
2. 보상을 획득할 수 있는 그룹 (실험군) VS 보상을 획득할 수 없는 그룹 (대조군)
BUT 보상을 획득할 수 있는 기능이 보여지는 여부와 별개로, 유저가 보상 획득 여부를 선택할 수 있는 형태 (예시: Gamification 이 적용된 뱃지)
✔ 도구변수 : 보상 획득 기능을 Random Assigned 50%:50% 로 노출할 경우 그 여부
3. 검색하면 광고를 볼 수 있는 그룹 (실험군) VS 검색해도 광고를 볼 수 없는 그룹 (대조군)
BUT 광고 기능이 보여지는 여부와 별개로, 유저가 검색을 해야 광고를 볼 수 있는 형태 (예시: Google 검색 광고)
✔ 도구변수 : 광고 기능을 Random Assigned 50%:50% 로 노출할 경우 그 여부

다음 시리즈에서는,

도구변수로 Randomized Experiment 에서의 Non-compliance 문제 해결하기를 세션에서 다뤄진 연구 사례와, 실무에서 2SLS를 사용했던 사례를 통해서 살펴볼 예정이니 기대해주세요! 😊

--

--

Bonnie BK
BON DATA

옆 동네 데이터 분석가, 데이터로 유저의 행동을 이해하고 인과관계를 파악합니다. Contact me through 🔗 https://www.linkedin.com/in/b-choi/ 🗂 https://www.slideshare.net/choibokyung/presentations