로지스틱 회귀 적용 환경 이해하기

    로지스틱 회귀는 훌륭한 이진 분류 알고리즘입니다. 그러나 데이터 양이 많아도 품질이 좋지 못한 경우에는 좋은 성능을 기대하기 어렵습니다. 로지스틱 회귀는 상대적으로 단순한 패턴만 파악할 수 있기 때문입니다. 로지스틱 회귀는 성능이 아주 뛰어나지는 않습니다만, 다른 모델을 위한 벤치마크 용도로 자주 사용합니다.

     

    분류 문제에 로지스틱 회귀 적용하기

    이 절에서는 로지스틱 회귀로 분류 문제를 풀어 보겠습니다.

    1. 로지스틱 회귀 모델 인스턴스를 생성하고 훈련 데이터로 모델을 훈련합니다.

    [in :]

    from sklearn.linear_model import LogisticRegression 
    classifier = LogisticRegression(random_state = 0) 
    classifier.fit(X_train, y_train)

    2. 훈련된 모델을 이용해 테스트 데이터의 라벨을 예측하고 혼동 행렬을 생성합니다.

    [in :]

    y_pred = classifier.predict(X_test)
    cm = metrics.confusion_matrix(y_test, y_pred) 
    cm

    이 코드를 실행하면 다음과 같은 혼동 행렬을 얻게 됩니다.

    [out:]

    Array([[65,  3],
           [ 6, 26]])
    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.