더북(TheBook)

단어의 빈도수를 확인해 보자.

list(tokenizer.word_counts.items())[:5]

실행 결과

[('우리아이의', 2), ('배정', 11), ('초등학교를', 2), ('알고', 45), ('싶어요', 7)]

 

이번에는 단어별 빈도를 고빈도순으로 정렬해 보자.

word_df = pd.DataFrame(tokenizer.word_counts.items(), columns = ['단어', '빈도수'])
word_df.sort_values(by="빈도수", ascending=False).T
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.