7.9 핵심 요약
1. 지도 학습(supervised learning)
- 관심 대상이 되는 변수 Y값을 예측하는 기법이다.
- Y값을 예측하거나 Y가 갖는 범주를 예측할 수 있다.
- 예 회귀(regression)와 분류(classification)
2. 선형 회귀(linear regression) 분석
- 주어진 X로 Y를 예측하는 수학적 모형을 발견하는 분석이다.
- X는 독립 변수, Y는 종속 변수라 지칭한다.
- 선형 회귀 분석은 X와 Y 사이의 직선식을 발견하며, 직선식은 X의 계수와 Y 절편을 통해 구할 수 있다.
3. 선형 회귀 분석의 해석
- 선형 회귀 분석 결과 중 결정계수(R2)는 모형에 포함된 변수 X가 자료를 얼마나 잘 설명하는지를 알려주며 0~1 사이의 값을 갖는다.
- 결과 중 각 변수 X에 대한 추정된 계수(estimated coefficient)는 각 X 변수가 Y에 어떤 연관이 있는지를 제시한다.
- 계수는 X가 1단위 증가할 때 Y가 얼마나 변하는지를 알려주는 기울기이다.
- 추정된 계수는 p값을 통해 계수가 유의한지를 알 수 있다.
- 일반적으로 p값이 5%보다 작으면 추정된 계수가 통계적으로 유의하다고 해석한다.