모두의 한국어 텍스트 분석 with 파이썬: 5 주제별 글자와 단어의 빈도 확인

토픽별로 단어 수의 분포를 보면 (큰 차이는 없지만) IT과학, 생활문화는 y축 값이 다른 주제에 비해 빈도가 적다. 이를 정답값의 빈도수와 비교해 볼 필요가 있다.

sns.displot(data=df, x="word_count",
            hue="topic", col="topic", col_wrap=2, aspect=5, height=2)

실행 결과

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.