더북(TheBook)

로지스틱 회귀 적용 환경 이해하기

로지스틱 회귀는 훌륭한 이진 분류 알고리즘입니다. 그러나 데이터 양이 많아도 품질이 좋지 못한 경우에는 좋은 성능을 기대하기 어렵습니다. 로지스틱 회귀는 상대적으로 단순한 패턴만 파악할 수 있기 때문입니다. 로지스틱 회귀는 성능이 아주 뛰어나지는 않습니다만, 다른 모델을 위한 벤치마크 용도로 자주 사용합니다.

 

분류 문제에 로지스틱 회귀 적용하기

이 절에서는 로지스틱 회귀로 분류 문제를 풀어 보겠습니다.

1. 로지스틱 회귀 모델 인스턴스를 생성하고 훈련 데이터로 모델을 훈련합니다.

[in :]

from sklearn.linear_model import LogisticRegression 
classifier = LogisticRegression(random_state = 0) 
classifier.fit(X_train, y_train)

2. 훈련된 모델을 이용해 테스트 데이터의 라벨을 예측하고 혼동 행렬을 생성합니다.

[in :]

y_pred = classifier.predict(X_test)
cm = metrics.confusion_matrix(y_test, y_pred) 
cm

이 코드를 실행하면 다음과 같은 혼동 행렬을 얻게 됩니다.

[out:]

Array([[65,  3],
       [ 6, 26]])
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.