4.1.2절에서 단어 가방 모형을 만든 것과 마찬가지로, TfidfVectorizer()의 기본값으로 CountVectorizer()와 동일하게 변환해 보자. 이때도 fit(), transform() 또는 fit_transform()을 사용할 수 있다.
# sklearn.feature_extraction.text에서 # TfidfVectorizer를 불러온다. # fit, transform으로 변환한다. from sklearn.feature_extraction.text import TfidfVectorizer tfidfvect = TfidfVectorizer() tfidfvect.fit(corpus) dtm = tfidfvect.transform(corpus) dtm
실행 결과
<4x9 sparse matrix of type '<class 'numpy.float64'>' with 14 stored elements in Compressed Sparse Row format>