더북(TheBook)

조금 더 알아보기 쉽게 이 상관관계를 그래프로 표현해 보겠습니다. 맷플롯립(matplotlib)은 파이썬에서 그래프를 그릴 때 가장 많이 사용되는 라이브러리입니다. 이를 기반으로 조금 더 정교한 그래프를 그리게 해 주는 시본(seaborn) 라이브러리까지 사용해서 각 정보 간 상관관계를 가시화해 보겠습니다. 먼저 그래프의 색상과 크기를 정합니다.

colormap = plt.cm.gist_heat    # 그래프의 색상 구성을 정합니다.
plt.figure(figsize=(12,12))    # 그래프의 크기를 정합니다.

시본 라이브러리 중 각 항목 간 상관관계를 나타내는 heatmap() 함수를 통해 그래프를 표시해 봅시다. heatmap() 함수는 두 항목씩 짝을 지은 후 각각 어떤 패턴으로 변화하는지 관찰하는 함수입니다. 두 항목이 전혀 다른 패턴으로 변화하면 0을, 서로 비슷한 패턴으로 변할수록 1에 가까운 값을 출력합니다.

sns.heatmap(df.corr(), linewidths=0.1, vmax=0.5, cmap=colormap, 
linecolor='white', annot=True)
plt.show()

TIP

vmax는 색상의 밝기를 조절하는 인자입니다. cmap은 미리 정해진 맷플롯립 색상의 설정 값을 불러옵니다. 색상 설정 값은 https://matplotlib.org/users/colormaps.html에서 확인할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.