더북(TheBook)

이제 transform()으로 단어 문서 행렬로 변환한다. transform 이후에는 행렬로 변환되어 숫자 형태로 변경되는데 그 결과는 feature_tfidf로 받는다.

train_feature_tfidf = tfidf_vect.transform(X_train)
test_feature_tfidf = tfidf_vect.transform(X_test)
 
train_feature_tfidf.shape, test_feature_tfidf.shape

실행 결과

((45654, 22377), (9131, 22377))
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.