4 맷플롯립과 시본을 이용해 히스토그램으로 시각화
앞에서 결과로 나온 표의 데이터 분포를 한눈에 알 수 있도록 맷플롯립과 시본을 이용해 히스토그램으로 시각화해 보자.
➊ 맷플롯립으로 1행 3열의 그래프를 그린다.
➋ 각 열에서는 sns.histplot()으로 낱글자, 어절(토큰), 중복을 제외한 유일 어절의 길이를 시각화한다. 이미 앞에서 맷플롯립은 plt로, 시본은 별칭인 sns로 임포트했기 때문에 여기서는 이를 사용해 관측한 개수를 세어 표시할 것이다.
➌ axes는 축에 해당한다. axes에 0, 1, 2를 넣어 그릴 순서를 정해 준다.
fig, axes = plt.subplots(1, 3, figsize=(15, 2)) ————➊ sns.histplot(df["len"], ax=axes[0]) ————➋,➌ sns.histplot(df["word_count"], ax=axes[1]) sns.histplot(df["unique_word_count"], ax=axes[2])
실행 결과