더북(TheBook)

7 boxplot( ) 함수: 상자 그림 그리기

상자 그림(box plot(박스 플롯))은 최댓값, 최솟값, 중앙값, 사분위수, 이상치 등을 알아보기 쉽게 나타내는 그래프입니다. 상자 그림은 데이터 분포를 확인하는 데 요긴하게 사용할 수 있습니다. 박스 아랫면 라인은 데이터 값의 1사분위수(=Q1, 25% 위치), 박스 중앙 라인은 2사분위수(=Q2, 중앙값, 50% 위치), 박스 윗면 라인은 3사분위수(=Q3, 75% 위치)를 가리킵니다. 위아래로 뻗은 선을 수염(whisker)이라고 하며, 수염 밖을 벗어난 점을 이상치(outlier)라고 합니다. (Q1 - 1.5 * 사분위수 범위)보다 작거나 (Q3 + 1.5 * 사분위수 범위)보다 크면 그 값을 이상치라고 하는데, 통계적으로 정상 범주에서 벗어난 값이라고 알아 둡니다.

 

그림 6-52 | 상자 그림 의미

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.