Asset Horizon
Dummy Variables 본문
OLS 회귀분석을 할 때, 독립 변수로 ‘더미 변수’를 사용할 수 있다. 더미 변수는 특정한 조건에 부합할 경우 1, 아닐 경우 0으로 나타나는 변수이다. 예를 들어, 시험 점수를 종속 변수로 하여 회귀분석을 할 때, 성별을 독립 변수로 사용하는 경우를 생각해보자. 남자일 경우 1, 그렇지 않을 경우 0으로 나타나는 더미 변수를 활용해 회귀분석을 시행할 수 있다
이렇게 더미 변수를 활용한 OLS 회귀분석을 식으로 나타내면 다음과 같다.
더미 변수가 0인 경우와 1인 경우를 각각 나누어 살펴보자. 먼저 더미 변수 D가 0인 경우 Beta_1 Term이 사라진다. 따라서 Beta_0^은 D가 0일 때 Y의 평균 값이 된다. (종속 변수 Y에 대해 독립 변수 없이 상수항, 즉 Beta_0만으로 회귀분석 할 경우 상수항 계수는 종속 변수 Y의 단순 평균이다.) 위의 예시에 다시 대입해보면, Beta_0^은 여학생들의 평균 점수가 된다.
더미 변수가 1인 경우 Beta_0^과
Beta_1^의 합을 보아야 한다. 더미 변수가 1인 경우의 종속변수의 평균이 이 두 합으로 표현 되기 때문이다. 따라서
Beta_1^은 더미 변수가 1인 경우의 종속 변수의 평균에서
더미 변수가 0인 경우의 종속 변수의 평균을 차감한 값이 된다. 다시
예로 돌아가서 보면, Beta_1^은 남자의 평균 점수에서 여자의 평균 점수를 뺀 값이 된다.
남자, 여자와 같이 두 분류로 나누어 회귀분석을 실시하기 위해서는 하나의 더미 변수가 필요하다. 하지만 중학생, 고등학생, 대학생 등 세 분류로 나누어 회귀분석을 실시하기 위해서는 더미변수가 두 개 필요하다. 다시 말해 N개로 분류할 경우 더미 변수는 N-1개 필요한데, 이때 더미 변수로 지정되지 않은 분류는 Baseline Case로 불린다. 위의 예시에서는 남자가 더미변수 D에서 1로 지정되었기 때문에 여자인 경우가 Baseline Case가 된다.
'Studies > Basic Econometrics' 카테고리의 다른 글
Causal Effect (0) | 2017.11.12 |
---|---|
Misspecified Models (0) | 2017.11.12 |
R-Squared (0) | 2017.10.14 |
Gauss-Markov Theorem (0) | 2017.10.13 |
Classical Assumptions on DGP & Statistical Properties of the OLS (0) | 2017.10.13 |