더북(TheBook)

이 장에서는 TfidfVectorizer()를 사용해 보겠다. 사이킷런에서 사용할 수 있는 TfidfVectorizer()를 임포트하고 잘 임포트됐는지 확인해 보자.

from sklearn.feature_extraction.text import TfidfVectorizer
 
tfidf_vect = TfidfVectorizer(tokenizer=None, 
                             ngram_range=(1,2),
                             min_df=3, 
                             max_df=0.95)
tfidf_vect.fit(X_train)

실행 결과

TfidfVectorizer(max_df=0.95, min_df=3, ngram_range=(1, 2))
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.