더북(TheBook)

3.1.4 로지스틱 회귀와 선형 회귀

회귀란 변수가 두 개 주어졌을 때 한 변수에서 다른 변수를 예측하거나 두 변수의 관계를 규명하는 데 사용하는 방법입니다. 이때 사용되는 변수 유형은 다음과 같습니다.

독립 변수(예측 변수): 영향을 미칠 것으로 예상되는 변수

종속 변수(기준 변수): 영향을 받을 것으로 예상되는 변수

 

이때 두 변수 간 관계에서 독립 변수와 종속 변수의 설정은 논리적인 타당성이 있어야 합니다. 예를 들어 몸무게(종속 변수)와 키(독립 변수)는 둘 간의 관계를 규명하는 용도로 사용됩니다.

 

로지스틱 회귀

먼저 로지스틱 회귀 분석에 대해 살펴보겠습니다.

▼ 표 3-6 로지스틱 회귀를 사용하는 이유와 적용 환경

왜 사용할까?

주어진 데이터에 대한 분류

언제 사용하면 좋을까?

로지스틱 회귀 분석은 주어진 데이터에 대한 확신이 없거나(예를 들어 분류 결과에 대해 확신이 없을 때) 향후 추가적으로 훈련 데이터셋을 수집하여 모델을 훈련시킬 수 있는 환경에서 사용하면 유용합니다.

로지스틱 회귀(logistic regression)는 분석하고자 하는 대상들이 두 집단 혹은 그 이상의 집단으로 나누어진 경우, 개별 관측치들이 어느 집단으로 분류될 수 있는지 분석하고 이를 예측하는 모형을 개발하는 데 사용되는 통계 기법입니다. 따라서 일반적인 회귀 분석과는 차이가 있습니다.

▼ 표 3-7 일반 회귀 분석과 로지스틱 회귀 분석 차이

구분

일반적인 회귀 분석

로지스틱 회귀 분석

종속 변수

연속형 변수

이산형 변수

모형 탐색 방법

최소제곱법

최대우도법

모형 검정

F-테스트, t-테스트

X2 테스트

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.