이제 transform()으로 단어 문서 행렬로 변환한다. transform 이후에는 행렬로 변환되어 숫자 형태로 변경되는데 그 결과는 feature_tfidf로 받는다.
train_feature_tfidf = tfidf_vect.transform(X_train) test_feature_tfidf = tfidf_vect.transform(X_test) train_feature_tfidf.shape, test_feature_tfidf.shape
실행 결과
((45654, 22377), (9131, 22377))