모두의 한국어 텍스트 분석 with 파이썬: 10 예측하기

시험 데이터를 넣어서 예측할 차례다. predict() 메서드를 통해 시험 데이터의 텍스트가 어떤 분류에 속하는지 예측한다.

y_pred = model.predict(test_feature_tfidf)
y_pred[:10]

실행 결과

array([0, 0, 0, 0, 0, 0, 0, 0, 1, 0])

y_pred.shape로 확인해 보면 이전과 마찬가지로 1,533개다.

y_pred.shape

실행 결과

(1533,)

예측 결과를 데이터 프레임에 담아 준다.

output = pd.DataFrame(data={'votes_pos_neg_pred':y_pred})
output.head()

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.