▪︎ summary( ): 요약 통계량 확인
summary() 함수는 데이터의 요약 통계량을 출력합니다. 요약 통계량이란 요약된 통계 값을 의미합니다. summary() 함수는 데이터를 사전 분석할 때 데이터 특성을 알고자 자주 사용합니다.
> summary(iris) # iris 모든 열의 요약 통계량을 출력 Sepal.Length Sepal.Width Petal.Length Petal.Width Species Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 setosa :50 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 versicolor:50 Median :5.800 Median :3.000 Median :4.350 Median :1.300 virginica :50 Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800 Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
대표적인 요약 통계량은 다음 표와 의미가 같습니다.
표 6-9 | 요약 통계량 의미
요약 통계량 |
의미 |
설명 |
Min |
최솟값 |
데이터에서 가장 작은 값 |
1st Qu |
1사분위수 |
하위 25%의 위치 값 |
Median |
중앙값 |
50% 중앙의 위치 값 |
Mean |
평균 |
모든 값을 더해서 개수로 나눈 값 |
3rd Qu |
3사분위수 |
하위 75%의 위치 값 |
Max |
최댓값 |
데이터에서 가장 큰 값 |