3.1.4 로지스틱 회귀와 선형 회귀
회귀란 변수가 두 개 주어졌을 때 한 변수에서 다른 변수를 예측하거나 두 변수의 관계를 규명하는 데 사용하는 방법입니다. 이때 사용되는 변수 유형은 다음과 같습니다.
• 독립 변수(예측 변수): 영향을 미칠 것으로 예상되는 변수
• 종속 변수(기준 변수): 영향을 받을 것으로 예상되는 변수
이때 두 변수 간 관계에서 독립 변수와 종속 변수의 설정은 논리적인 타당성이 있어야 합니다. 예를 들어 몸무게(종속 변수)와 키(독립 변수)는 둘 간의 관계를 규명하는 용도로 사용됩니다.
로지스틱 회귀
먼저 로지스틱 회귀 분석에 대해 살펴보겠습니다.
▼ 표 3-6 로지스틱 회귀를 사용하는 이유와 적용 환경
왜 사용할까? |
주어진 데이터에 대한 분류 |
언제 사용하면 좋을까? |
로지스틱 회귀 분석은 주어진 데이터에 대한 확신이 없거나(예를 들어 분류 결과에 대해 확신이 없을 때) 향후 추가적으로 훈련 데이터셋을 수집하여 모델을 훈련시킬 수 있는 환경에서 사용하면 유용합니다. |
로지스틱 회귀(logistic regression)는 분석하고자 하는 대상들이 두 집단 혹은 그 이상의 집단으로 나누어진 경우, 개별 관측치들이 어느 집단에 분류될 수 있는지 분석하고 이를 예측하는 모형을 개발하는 데 사용되는 통계 기법입니다. 따라서 일반적인 회귀 분석과는 차이가 있습니다.
▼ 표 3-7 일반 회귀 분석과 로지스틱 회귀 분석 차이
구분 |
일반적인 회귀 분석 |
로지스틱 회귀 분석 |
종속 변수 |
연속형 변수 |
이산형 변수 |
모형 탐색 방법 |
최소제곱법 |
최대우도법 |
모형 검정 |
F-테스트, t-테스트 |
X2 테스트 |