7. train_test_split으로 데이터를 나눕니다.

    [in :]

    from sklearn.model_selection import train_test_split 
    train_x , train_y ,test_x , test_y = train_test_split(x, y, test_size = 0.2, random_state = 2)

    8. 예측하려는 라벨이 이진 변수이므로 분류 모델을 만들어야 합니다. 로지스틱 회귀 모델을 사용하는 것이 좋겠습니다. 먼저 로지스틱 회귀 모델 인스턴스를 생성합니다.

    [in :]

    model = LogisticRegression()

    9. train_xtrain_y로 모델을 훈련합니다.

    [in :]

    model.fit(train_x, train_y)

    10. 훈련이 끝나면 테스트 데이터로 예측을 수행합니다.

    [in :]

    predict = model.predict(test_x)

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.