【Causal Inference②】조작변수법(IV)에 관하여
* RCT를 사용할 수 없을 때는 어떻게 할까?
Level 1. 실험(Experimental) 레벨 (개입연구)
- 관찰자(해석자)가 개입의 계획을 세워서 데이터를 수집 \(\rightarrow\) RCT (무작위화비교실험)
\(\blacktriangleright\) Level 2. 준실험(Quasi Experimental) 레벨
비교적 질 좋은 관찰연구 정도의 느낌
실험데이터가 아니라 관찰데이터 를 사용해서, 개입의 여부 등으로 결과에의 영향을 추정
측정되지 않은 교란인자를 처리할 수 있는 것은 사실상 RCT만이 쉽게 가능하지만, 모든 교란인자를 충분히 측정할 수 있다고 하면 준실험설계로도 충분히 인과관계를 설명할 수 있다.
변수조작법(IV) , 차의 차 분석(DID) , 경향스코어 매칭(PS) , 회귀불연속 디자인(RDD) 등이 있다.
Level 3. 관찰(Observation) 레벨
- 더욱 인과추론 하기에 취약한 관찰연구 디자인
\(I\). 조작변수법 (IV; Instrumental variable methods)
- 조작변수법이란?
- 매우 어렵지만 이론상 완벽하게 설계된다면 측정되지 않은 교란인자 도 처리할 수 있는 방법.
외생변수 ; 모델의 밖에서 결정되어 주어진 변수 (설명변수로써 바람직하다).
- 모델의 잔차항 과 독립하게 된다.
내생변수 ; 모델 내에서 결정되는 변수 (설명변수로써 바람직하지 않다).
- 예를 들어 측정되지 않은 교란인자 가 있는 경우 영향을 받는 설명변수와 모델의 잔차항 사이에 상관 관계가 생겨버리고 이 설명변수는 내생변수 가 되어 내생성 바이어스 를 만든다.
이렇게 발생된 내생변수 를 외생화 하기 위해 도입된 변수 \(Z\)를 조작변수(IV) 라고 한다.
이러한 조작변수를 이용해, 설명변수가 결과에 미치는 영향을 평가하는 방법을 조작변수법 이라고 한다.
\([ 예시 ]\)
- 참의 관계 : \(ln(wage) = a + b \cdot educ + c \cdot ability + u\)
임금(Wage)와 교육년수(Education)와 능력(Ability)은 위와 같은 관계가 있다고 가정한다.
그러나 능력은 실제로 측정불가하기 때문에 교육수준만으로 임금과의 관계를 설명하는 모델을 했다고 하자.
- \(ln(wage) = a' + b' \cdot educ + v\)
이 때, 능력(Ability)은 관측되지 않은 교란인자 가 되고 계수 \(b'\)에는 내생성 바이어스가 존재하게 된다.
- 조작변수법의 과정
내생변수 를 피설명변수로 별도의 조작변수 \(IV\)를 통해 설명하는 모델을 작성한다.
- \(\begin{align} ln(wage) &= a' + b' \cdot educ + \underline v \\ &= a' + b' \cdot educ + \underline {c' \cdot X+ v'} \end{align}\)
\(\space\space\space\space\space\space\space\space\space\space\space\space\space\) (C를 잔차항에 포함된 교란인자 라고 가정)
- \(\bf educ = \alpha + \beta \cdot \underline {IV} + \gamma \cdot X + \epsilon\)
조작변수 \(\bf IV\)의 조건
Exclusion restriction
: IV는 원래의 결과부분에 해당하는 변수(Wage)에게 개입변수(설명변수, Education)를 통해서만 영향을 줄 수있다.No instrument-outcome confounder
:IV와 원래의 결과부분에 해당하는 변수(Wage)에게 동시에 영향을 주는 공통의 원인(L 또는 X) 이 존재하지 않아야 한다Instrument relevance
: 개입변수(설명변수, Education)에게는 확실히 영향을 주는 변수여야 한다.Monotonicity
: 조작변수가 역효과를 내는 사람(Defiers)이 존재하지 않아야 한다. (완전히 반대로 움직이는 케이스)
이상의 조건을 만족하는 조작변수를 발견해, 이를 통해 교란인자에 의한 효과를 제거한다.
【그러나, 이러한 조건을 만족하는 조작변수를 찾아내는 것은 매우 어렵고 특히 비즈니스 현장에서는 거의 불가능에 가깝다.】
\(I-I.\) 처치의도에 의한 분석 (Intention to treat analysis)
\(\space\space\space\space\space\) - 그럼에도 불구하고 생각해보는 조작변수법(IV)의 활용 가능성
- 실제 개입에서는 개입의 대상이지만 따르지 않는 경우나 대상이 아니지만 따르는 경우와 같이 참가자가 개입의도와 반대로 움직이는 경우가 존재한다.
'정책이나 치료와 같은 개입의 효과를 추정하기 위해서 개입의도대로 움직이는 부분집단만을 비교하는 것이 좋지 않을까' 라는 이론
개입을 행하는 참가자의 의도를 1과 0을 갖는 dummy 조작변수 \(z\) 로 생각한다.
- \(\begin{equation}z= \left \{\begin{array}{l}1 (개입의도 있음) \\0 (개입의도없음)\end{array}\right.\end{equation}\)
- \(d = zd_1 + (1-z)d_0\)
(\(d\)는 \(z\)가 1일 때 \(d_1\)이 되고, \(z\)가 0일 때 \(d_0\)이 된다.)
- \(\begin{equation}d= \left \{\begin{array}{l}1 (실행) \\0 (실행하지않음)\end{array}\right.\end{equation}\)
- \(y=dy_1 + (1-d)y_0\)
(마찬가지로 \(y\)는 \(d\)가 1일 때 \(y_1\)이 되고, \(d\)가 0일 때 \(y_0\)이 된다.)
조작변수\(z\)의 가정
\(\bf (y_0,y_1) \perp z|d,\) : 변수 \(d\)에 의해 \(z\)와 \(y\)가 \(d\)-seperate 되므로
Exclusion restriction
와No instrument-outcome confounder
만족\(\bf d_{i1} \geq d_{i0}\) :
Monotonicity
만족 (제비에 뽑히면 공립에 가고, 제비에 떨어지면 사립에 가는 Defiers는 존재하지 않는다고)(\(d\)와 \(z\)의 정의에 의해
Instrument relevance
는 자동으로 만족)
설계자의 의도 \(z\) | 참가자의 의사 \(d\) | Notation | 상황의 해석 |
---|---|---|---|
1 | 1 | \(d_1\) = 1 | 개입의 대상이 되어서 참가자가 개입의도에 맞게 따르는 경우 |
1 | 0 | \(d_1\) = 0 | 개입의 대상이 되었지만 참가자가 개입의도에 따르지 않는 경우 (noncompliance) |
0 | 1 | \(d_0\) = 1 | 개입의 대상이 아님에도 불구하고 개입의도의 방향으로 움직이는 경우 (noncompliance) |
0 | 0 | \(d_0\) = 0 | 개입의 대상이 아니였기 때문에 개입의도에 따르지 않는 경우 |
- 국소적 평균효과(LATE; local average treatment effect)
정의 ; \(\Large LATE = E(y_1-y_0|d_1=1,d_0=0)\)
의미 ; 개입의도의 방향대로 움직여주는 부분집합에서만 측정한 효과
- LATE의 추정
조작변수 \(z\)의 가정에 의해,
\(\begin{align} E(y|z=1) - E(y|z=0) &= E(dy_1+(1-d)y_0|z=1) - E(dy_1+(1-d)y_0| z=0)\\ &= E(d_1y_1+(1-d_1)y_0|z=1)-E(d_0y_1+(1-d_0)y_0|z=0) \\ &= E(d_1y_1 + (1-d)y_0)-E(d_0y_1 + (1-d_0)y_0)\\ &= E((d_1-d_0)(y_1-y_0)) \\ &\space \\ &\space\space\space\space\space\space\space\space\space\space\space\cdots d_1-d_0는\space\{-1,0,1\},\space\space Monotonicity가정에\space\space의해\space\space p(d_1-d_0=-1)=0 \space\space 이므로\\ &\space \\ &=\sum_{a=-1,0,1}aE(y_1-y_0|d_1-d_0 = a)p(d_1-d_0 = a) \\ &= \underline {E(y_1-y_0|d_1-d_0=1)} \space p(d_1-d_0=1) \end{align}\)
위 식의 우변에 \(E(y_1-y_0|d_1-d_0=1)\)가 \(\bf LATE\) 의 정의가 되므로,
\(\begin{align} {\bf LATE} &= E(y_1-y_0|d_1-d_0=1) \\ &\space \\ &= \cfrac{E(y|z=1) - E(y|z=0)}{p(d_1-d_0=1)} \\&\space \\ &= \cfrac{E(y|z=1) - E(y|z=0)}{ p(d_1=1,d_0=0)} \\ &\space \\ &= \cfrac{E(y|z=1) - E(y|z=0)}{\{p(d_1=1,d_0=1) + p(d_1=1,d_0=0)\} - p(d_0=1,d_1=1)} \\ &\space \\ &= \cfrac{E(y|z=1) - E(y|z=0)}{p(d_1=1)-p(d_0=1)} \\ &\space \\ &= {\bf \cfrac{E(y|z=1) - E(y|z=0)}{E(d|z=1)-E(d|z=0)}} \end{align}\)
로 바꿔쓰는 것이 가능해, 이것은 \(z\)가 2진변수(binary variable)인 경우의 조작변수추정량 과 같고, \(\bf LATE\)는 이것으로 추정가능하게 된다.
[예시]
콜롬비아에서 이루어진 '바우쳐제도'는 학업성적 향상의 효과가 있었을까?
[상황설명]
- 바우쳐제도란, 제비뽑기로 장학생을 선정해서 사립 중학교의 수업료 절반을 부담해주는 제도이다.
- 그러나 바우쳐제도 만으로 수업료를 감당하기 힘들어 제비뽑기에서 선발되어도 사립중학교의 입학을 포기하는 학생들이 존재했다.
- 부모님들의 경제적능력이 좋거나 사립학교를 선호하는 학생들은 제비뽑기에서 떨어져도 사립학교에 입학했다.
[가정 (실제 데이터가 아님) ]
- 1,000명의 학생이 제비를 뽑아 당첨된 학생은 300명이였다.
- 제비에 당첨된 300명의 학업성적의 평균은 80점
- 제비에 당첨되지 않은 700명의 학업성적은 60점
- 제비에 당첨됐을 때 사립학교에 진학학 확률은 90%
- 제비에 당첨되지 않았음에도 사립학교에 진학할 확률은 15%
- \(\begin{equation}z= \left \{\begin{array}{l}1 (제비뽑기당첨) \\0 (제비뽑기탈락)\end{array}\right.\end{equation}\)
- \(d = zd_1 + (1-z)d_0\)
- \(\begin{equation}d= \left \{\begin{array}{l}1 (사립학교진학) \\0 (공립학교진학)\end{array}\right.\end{equation}\)
- \(y=dy_1 + (1-d)y_0\) (성적)
여기서 우리가 궁금한 것은 [바우쳐제도] \(\rightarrow\) [사립학교진학] \(\rightarrow\) [성적향상] 의 인과스토리(causal story)를 가진 효과이다.
그러므로 우리가 관심있는 케이스는 제비뽑기에 붙으면 사립학교에 가고 떨어지면 공립학교에 진학할 학생 이다.
즉, 제비뽑기에 붙던 안붙던 사립학교에 갈 학생 (\(d_1=1,d_0=1\))이나 붙던 안붙던 공립학교에 갈 학생 (\(d_1=0,d_0=0\))은 고려의 대상이 아니다.
따라서, \(ATE = E(y_1-y_0)\) 를 구하면 단순히 사립학교와 공립학교의 성적 차이를 구하게 된다.
이 경우 \({\bf LATE} = E(y_1-y_0|d_1=1,d_0=0)\) 를 구하는 것이 바람직할 것이다.
\({\bf LATE}\)의 추정
\(E(y|z=1) = 80\)
\(E(y|z=0) = 60\)
\(E(d|z=1) = 0.9\)
\(E(d|z=0) = 0.15\)
\(\begin{align} LATE &= \cfrac{E(y|z=1) - E(y|z=0)}{E(d|z=1)-E(d|z=0)}\\ &\space \\ &= \cfrac{80-60}{0.9-0.15} \fallingdotseq 26.6666 \end{align}\)
국소적 평균효과(LATE)의 관점에서 26.66점의 성적향상효과가 있었다고 추정할 수 있다.
【결론】이와 같이 준실험으로써의 조작변수법은 상당이 어렵지만 \(\bf LATE\) 의 아이디어로써의 조작변수법은 생각해볼만 하다.
* Reference
해당 포스트는 유튜브 채널「データの科学のメソドロジー」의 山田典一님의 강의를 틀로 내용을 정리 & 추가 했음을 밝힙니다.
그 외 참조