프로그래머가 알아야 할 알고리즘 40: 7.2.6 로지스틱 회귀 알고리즘

로지스틱 회귀 적용 환경 이해하기

로지스틱 회귀는 훌륭한 이진 분류 알고리즘입니다. 그러나 데이터 양이 많아도 품질이 좋지 못한 경우에는 좋은 성능을 기대하기 어렵습니다. 로지스틱 회귀는 상대적으로 단순한 패턴만 파악할 수 있기 때문입니다. 로지스틱 회귀는 성능이 아주 뛰어나지는 않습니다만, 다른 모델을 위한 벤치마크 용도로 자주 사용합니다.

분류 문제에 로지스틱 회귀 적용하기

이 절에서는 로지스틱 회귀로 분류 문제를 풀어 보겠습니다.

1. 로지스틱 회귀 모델 인스턴스를 생성하고 훈련 데이터로 모델을 훈련합니다.

[in :]

from sklearn.linear_model import LogisticRegression 
classifier = LogisticRegression(random_state = 0) 
classifier.fit(X_train, y_train)

2. 훈련된 모델을 이용해 테스트 데이터의 라벨을 예측하고 혼동 행렬을 생성합니다.

[in :]

y_pred = classifier.predict(X_test)
cm = metrics.confusion_matrix(y_test, y_pred) 
cm

이 코드를 실행하면 다음과 같은 혼동 행렬을 얻게 됩니다.

[out:]

Array([[65,  3],
       [ 6, 26]])

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.