[계량경제학] DD and DDD
- Minwu Kim
- 2024년 4월 9일
- 2분 분량
1.Difference in Difference를 사용하는 이유
어떤 정책이나 처치의 효과를 계산할 때, 시간차를 두고 그 처치효과가 발현 되는 경우가 있다. 예컨데 금리인상을 하면 물가가 잡히기까지 약 반 년의 시간차가 있고, 약을 먹어도 몇 달은 지나야 호전되는 경우가 있다.
그렇다면 이 처치효과를 계산하려면 어떻게 해야할까. 가장 직관적으로 떠오르는 방법이 있다. 바로 처치 전과 처치 후를 비교해보는 것이다. 예를 들어 다이어트 약의 효과를 알려면 약 먹은 전과 후의 몸무게 변화를 계산할 수 있을 것이다.
하지만 이 방법은 문제가 있다. 복용 전과 후 약 1개월의 텀이 있었다고 하자. 그 1개월 동안 어떠한 몸무게의 변화를 야기한 데에는, 비단 약 뿐만이 아니라 다른 요소들도 있었을 것이다. 식단이 바뀌었을 수도 있고, 운동량이 바뀌었을 수도 있고, 수면시간이 바뀌었을 수도 있을 것이다. 이렇듯, 약효와는 무관한 요소들이 개입할 수 있었을 것이다.
아주 극단적인 예시를 들어보자. 약효가 없는, 즉 살이 안 빠지는 짝퉁 다이어트 약이 있다. 그리고 이 약의 약효를 앞선 방식으로 계량해보려 한다. 이 제약사는 사람들을 한 곳에 모아 같은 밥을 주면서 실험을 진행한다. 문제는 이 곳의 밥이 정말 맛이 없다는 것이다. 그래서 사람들이 밥을 덜 먹는다. 그래서 살이 빠진다. 이 실험 결과, 약 복용 전후 사람들의 체중이 평균 3키로가 빠졌다. 이 3키로 중 약이 기여한 부분은 전혀 없다.
이 문제를 해결하기 위해 통계학자들은 이런 방법을 고안해낸다: 실험군을 A와 B 두 그룹으로 나눈다. 그리고 A한테는 약을 주고, B쪽에는 약을 안 준다. 그렇게 1개월 동안 실험을 진행했다. 그리고 결과는 아래와 같다:
A그룹: 평균 1키로 감량
B그룹: 평균 5키로 감량
고로 약효는 4키로이다. 나머지 1키로는 약을 먹었는지 말았는지와는 상관이 없이 부분이다. 약효와는 상관 없는 부분을 control 그룹을 통해 유추해내는 것이 바로 핵심 아이디어이다. 상당히 간단한 아이디어이다. 이게 바로 difference in difference이다. 흔히들 줄여서 DD라고 한다.
아래의 그림을 보면 보다 더 직관적으로 이해할 수 있다:
2. Parallel trend assumption
여기서 중요한 포인트가 있다. DD는 처치 외의 시간에 따른 변화를 통제집단을 통해 구해낸다. 그리고 그 변화량이 처치집단이 처치 받지 않았을 경우에도 (counterfactual) 동일하다고 가정한다. 즉, 두 그룹에서 시간에 따른 변화는 똑같다고 상정하는 것이다. 이것을 parallel trend assumption이라고 한다.
이 가정을 위해선 A와 B 두 그룹이 최대한 homogeneous 해야한다. 고로, 여기서도 random sampling이 몹시 중요하다.
3.DD의 수학적 이해

DD의 수식은 위와 같다. 우리가 최종적으로 구하고 싶은 것은 처치효과 델타1이다.
4. Test for parallel trend
앞선 예시는 시점이 오로지 두 개였는데, 위의 그림과 같이 시점이 여러개인 경우도 있다. 데이터를 통해서 treatment 이후에 평행 추세 가정을 실제로 확인할 수는 없다. 현실에서 아예 일어나지 않은 일이기 때문이다. 따라서 일반적으로는추가적인 통계 기법을 사용하여 parallel trend를 검증한다.
위의 그림을 수식으로 표현하면 아래와 같다 (t-3가 디폴트 값):
parallel trend를 검증하기 위해선 아래와 같은 가설검정이 필요하다:
beta6 = 0
beta7 = 0
beta8 = 0
참고로 beta9는 처치효과이기에 0인지 가설검정을 할 필요가 없다.
5. Triple difference를 사용하는 이유 및 수식
Triple difference(DDD)는 DD에서 한발짝 더 나아간다. DD로는 해결하지 못하는 문제가 있다. 바로 이질적 처치효과이다.
다시 다이어트 약의 예시로 돌아가보자. 비만인 사람에게 나타나는 약효와 정상체중인 사람에게 나타는 약효는 다를 것이다. 두 집단 간의 처치효과 차이를 DDD로 계산한다. 이를테면 이런 것이다:
과체중의 DD: 7kg
정상체중의 DD: 3kg
두집단 간의 차이는 4키로이다. 이걸 이질적 처치효과라고 하며 DDD의 아이디어이다.
수식은 아래와 같다:




댓글