더북(TheBook)

4.1.2절에서 단어 가방 모형을 만든 것과 마찬가지로, TfidfVectorizer()의 기본값으로 CountVectorizer()와 동일하게 변환해 보자. 이때도 fit(), transform() 또는 fit_transform()을 사용할 수 있다.

# sklearn.feature_extraction.text에서 
# TfidfVectorizer를 불러온다.
# fit, transform으로 변환한다.
from sklearn.feature_extraction.text import TfidfVectorizer
tfidfvect = TfidfVectorizer()
tfidfvect.fit(corpus)
dtm = tfidfvect.transform(corpus)
dtm

실행 결과

<4x9 sparse matrix of type '<class 'numpy.float64'>'
  with 14 stored elements in Compressed Sparse Row format>
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.