더북(TheBook)

7.9 핵심 요약

1. 지도 학습(supervised learning)

  • 관심 대상이 되는 변수 Y값을 예측하는 기법이다.
  • Y값을 예측하거나 Y가 갖는 범주를 예측할 수 있다.
  • 회귀(regression)와 분류(classification)

2. 선형 회귀(linear regression) 분석

  • 주어진 XY를 예측하는 수학적 모형을 발견하는 분석이다.
  • X는 독립 변수, Y는 종속 변수라 지칭한다.
  • 선형 회귀 분석은 XY 사이의 직선식을 발견하며, 직선식은 X의 계수와 Y 절편을 통해 구할 수 있다.

3. 선형 회귀 분석의 해석

  • 선형 회귀 분석 결과 중 결정계수(R2)는 모형에 포함된 변수 X가 자료를 얼마나 잘 설명하는지를 알려주며 0~1 사이의 값을 갖는다.
  • 결과 중 각 변수 X에 대한 추정된 계수(estimated coefficient)는 각 X 변수가 Y에 어떤 연관이 있는지를 제시한다.
  • 계수는 X가 1단위 증가할 때 Y가 얼마나 변하는지를 알려주는 기울기이다.
  • 추정된 계수는 p값을 통해 계수가 유의한지를 알 수 있다.
  • 일반적으로 p값이 5%보다 작으면 추정된 계수가 통계적으로 유의하다고 해석한다.
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.