토픽별로 단어 수의 분포를 보면 (큰 차이는 없지만) IT과학, 생활문화는 y축 값이 다른 주제에 비해 빈도가 적다. 이를 정답값의 빈도수와 비교해 볼 필요가 있다.
sns.displot(data=df, x="word_count", hue="topic", col="topic", col_wrap=2, aspect=5, height=2)
실행 결과

토픽별로 단어 수의 분포를 보면 (큰 차이는 없지만) IT과학, 생활문화는 y축 값이 다른 주제에 비해 빈도가 적다. 이를 정답값의 빈도수와 비교해 볼 필요가 있다.
sns.displot(data=df, x="word_count", hue="topic", col="topic", col_wrap=2, aspect=5, height=2)
실행 결과