그래프 모양을 보니 마치 혹이 두 개 달린 낙타 등처럼 보입니다. 겨울과 여름 계절의 패턴이 이렇게 나타난 걸까요? 이번에는 8월 데이터만 뽑아서 히스토그램으로 그려보겠습니다.
import csv import matplotlib.pyplot as plt f = open('seoul.csv') data = csv.reader(f) next(data) aug = [] # 8월의 최고 기온 값을 저장할 aug 리스트 생성 for row in data : month = row[0].split('-')[1] # -로 구분된 값 중 2번째 값을 month에 저장 if row[-1] != '' : if month == '08': # 8월달이라면 aug.append(float(row[-1])) # aug 리스트에 최고 기온 값 추가 plt.hist(aug, bins=100, color='r') plt.show()
그림 6-9 8월 데이터만 뽑아서 히스토그램으로 나타낸 결과
매년 8월 데이터를 히스토그램으로 표현하니 종 모양(또는 수학 시간에 배웠던 정규 분포 그래프)처럼 나타납니다. 역대 8월에는 최고 기온이 30도 정도였던 날이 가장 많았고, 최고 기온이 20도 이하이거나 40도에 가까웠던 적은 거의 없었다는 것을 쉽게 알 수 있습니다.