더북(TheBook)

1월과 8월의 최고 기온을 히스토그램으로 표현한 결과와 상자 그림으로 표현한 결과를 비교하고, 상자 그림에 표현된 의미를 파악해 봅시다. 히스토그램에서는 추측을 통해 파악할 수 있었던 최솟값, 최댓값, 1/4, 2/4, 3/4 값의 위치를 비교적 명확하게 확인할 수 있습니다.

상자 그림의 위, 아래에 그려진 동그라미는 무엇을 의미할까요? 이는 이상치(outlier) 값을 표현한 것으로, 다른 수치에 비해 너무 크거나 작은 값을 자동으로 나타낸 것입니다.

만약 8월의 최고 기온 데이터와 1월의 최고 기온 데이터를 원소로 하는 리스트를 boxplot() 함수로 표현한다면 어떤 결과가 나타날까요?

plt.boxplot([aug,jan])

그림 6-14 1월의 최고 기온 데이터를 원소로 하는 리스트를 boxplot() 함수로 나타낸 결과

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.