모두의 한국어 텍스트 분석 with 파이썬: 4 pyLDAvis를 통한 시각화하기

dtm_tfidf를 axis=0(수직 방향으로) 기준으로 합계를 낸 dist 변수를 생성한다. dist 변수를 vocabulary_ 순으로 정렬해 비율을 확인한다.

dist = np.sum(dtm_tfidf, axis=0)
pd.DataFrame(dist, columns=cols_tfidf).T.sort_values(by=0).tail(10)

실행 결과

추천 도서와 신규 콘텐츠를 먼저 받아보세요