더북(TheBook)

4 워드클라우드 그리기

 

이제 워드클라우드를 그려 보자. 바탕색을 흰색으로 지정하고(바탕색, 크기 등을 각각 지정할 수 있다), 고빈도로 등장하지만 내용을 파악하는 데 크게 영향을 주지 않는 단어들을 불용어 리스트로 지정해 제거한다.

!apt -qq -y install fonts-nanum
from wordcloud import WordCloud
import matplotlib.pyplot as plt
 
def display_word_cloud(data, width=1200, height=500):
  
   stopwords = ['하지만', '그리고', '그런데', '저는','제가',
               '그럼', '이런', '저런', '합니다',
               '많은', '많이', '정말', '너무']
  
   word_draw = display_word_cloud(
       font_path=r"/Library/Fonts/NanumGothic.ttf",
       width=width, height=height,
       stopwords=stopwords,
       background_color="white",
       random_state=42
   )
   word_draw.generate(data)
 
   plt.figure(figsize=(15, 7))
   plt.imshow(word_draw)
   plt.axis("off")
   plt.show()
 
   plt.show()
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.