10 예측하기
시험 데이터를 넣어서 예측할 차례다. predict() 메서드를 통해 시험 데이터의 텍스트가 어떤 분류에 속하는지 예측한다.
y_pred = model.predict(test_feature_tfidf) y_pred[:10]
실행 결과
array([0, 0, 0, 0, 0, 0, 0, 0, 1, 0])
y_pred.shape로 확인해 보면 이전과 마찬가지로 1,533개다.
y_pred.shape
실행 결과
(1533,)
예측 결과를 데이터 프레임에 담아 준다.
output = pd.DataFrame(data={'votes_pos_neg_pred':y_pred}) output.head()