로지스틱 회귀 적용 환경 이해하기
로지스틱 회귀는 훌륭한 이진 분류 알고리즘입니다. 그러나 데이터 양이 많아도 품질이 좋지 못한 경우에는 좋은 성능을 기대하기 어렵습니다. 로지스틱 회귀는 상대적으로 단순한 패턴만 파악할 수 있기 때문입니다. 로지스틱 회귀는 성능이 아주 뛰어나지는 않습니다만, 다른 모델을 위한 벤치마크 용도로 자주 사용합니다.
분류 문제에 로지스틱 회귀 적용하기
이 절에서는 로지스틱 회귀로 분류 문제를 풀어 보겠습니다.
1. 로지스틱 회귀 모델 인스턴스를 생성하고 훈련 데이터로 모델을 훈련합니다.
[in :]
from sklearn.linear_model import LogisticRegression
classifier = LogisticRegression(random_state = 0)
classifier.fit(X_train, y_train)
2. 훈련된 모델을 이용해 테스트 데이터의 라벨을 예측하고 혼동 행렬을 생성합니다.
[in :]
y_pred = classifier.predict(X_test)
cm = metrics.confusion_matrix(y_test, y_pred)
cm
이 코드를 실행하면 다음과 같은 혼동 행렬을 얻게 됩니다.
[out:]
Array([[65, 3],
[ 6, 26]])