Recent Posts
Recent Comments
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Today
Total
관리 메뉴

Asset Horizon

Dummy Variables 본문

Studies/Basic Econometrics

Dummy Variables

SHIN_HW 2017. 11. 8. 14:25

OLS 회귀분석을 할 때, 독립 변수로 더미 변수를 사용할 수 있다. 더미 변수는 특정한 조건에 부합할 경우 1, 아닐 경우 0으로 나타나는 변수이다. 예를 들어, 시험 점수를 종속 변수로 하여 회귀분석을 할 때, 성별을 독립 변수로 사용하는 경우를 생각해보자. 남자일 경우 1, 그렇지 않을 경우 0으로 나타나는 더미 변수를 활용해 회귀분석을 시행할 수 있다



이렇게 더미 변수를 활용한 OLS 회귀분석을 식으로 나타내면 다음과 같다.



더미 변수가 0인 경우와 1인 경우를 각각 나누어 살펴보자. 먼저 더미 변수 D0인 경우 Beta_1 Term이 사라진다. 따라서 Beta_0^D0일 때 Y의 평균 값이 된다. (종속 변수 Y에 대해 독립 변수 없이 상수항, Beta_0만으로 회귀분석 할 경우 상수항 계수는 종속 변수 Y의 단순 평균이다.) 위의 예시에 다시 대입해보면, Beta_0^은 여학생들의 평균 점수가 된다.




더미 변수가 1인 경우 Beta_0^Beta_1^의 합을 보아야 한다. 더미 변수가 1인 경우의 종속변수의 평균이 이 두 합으로 표현 되기 때문이다. 따라서 Beta_1^은 더미 변수가 1인 경우의 종속 변수의 평균에서 더미 변수가 0인 경우의 종속 변수의 평균을 차감한 값이 된다. 다시 예로 돌아가서 보면, Beta_1^은 남자의 평균 점수에서 여자의 평균 점수를 뺀 값이 된다.



남자, 여자와 같이 두 분류로 나누어 회귀분석을 실시하기 위해서는 하나의 더미 변수가 필요하다. 하지만 중학생, 고등학생, 대학생 등 세 분류로 나누어 회귀분석을 실시하기 위해서는 더미변수가 두 개 필요하다. 다시 말해 N개로 분류할 경우 더미 변수는 N-1개 필요한데, 이때 더미 변수로 지정되지 않은 분류는 Baseline Case로 불린다. 위의 예시에서는 남자가 더미변수 D에서 1로 지정되었기 때문에 여자인 경우가 Baseline Case가 된다.

'Studies > Basic Econometrics' 카테고리의 다른 글

Causal Effect  (0) 2017.11.12
Misspecified Models  (0) 2017.11.12
R-Squared  (0) 2017.10.14
Gauss-Markov Theorem  (0) 2017.10.13
Classical Assumptions on DGP & Statistical Properties of the OLS  (0) 2017.10.13
Comments