또한, 로지스틱 회귀 분석은 다음 절차에 따라 분석을 진행합니다.
• 1단계: 각 집단에 속하는 확률의 추정치를 예측합니다. 이때 추정치는 이진 분류의 경우 집단 1에 속하는 확률 P(Y=1)로 구합니다.
• 2단계: 분류 기준 값(cut-off)을 설정한 후 특정 범주로 분류합니다.
예 P(Y=1) ≥ 0.5 → 집단 1로 분류
P(Y=1) < 0.5 → 집단 0으로 분류
로지스틱 회귀 분석이 어렵게 느껴진다면 확률과 통계에 익숙하지 않기 때문입니다. 이쯤에서 인공지능 관련 수학을 다시 찾아보길 권합니다.
로지스틱 회귀 분석 코드를 살펴봅시다. 목표는 신규 데이터(숫자(digit))에 대한 정확한 예측입니다.
▲ 그림 3-19 로지스틱 회귀 분석 예제