[계량경제학] 선형회귀 - 데이터가 duplicate이 된다면
- Minwu Kim
- 2024년 3월 24일
- 1분 분량
선형회귀의 전제 중 하나는, 매트릭스가 full rank여야 한다는 것이다. 하지만 모든 데이터가 한 번 씩 duplicate가 되었다면?
estimator의 값은 바뀌지 않는다
R-squared의 값도 바뀌지 않는다
Variance가 sqrt(2)만큼 준다. 데이터의 중복은 모델의 설명력을 과대평가한다. 고로 variance는 실제값보다 줄어든다.
자세한 설명은 링크
댓글