더북(TheBook)

토픽별로 단어 수의 분포를 보면 (큰 차이는 없지만) IT과학, 생활문화는 y축 값이 다른 주제에 비해 빈도가 적다. 이를 정답값의 빈도수와 비교해 볼 필요가 있다.

sns.displot(data=df, x="word_count",
            hue="topic", col="topic", col_wrap=2, aspect=5, height=2)

실행 결과

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.