더북(TheBook)

▪︎ summary( ): 요약 통계량 확인

summary() 함수는 데이터의 요약 통계량을 출력합니다. 요약 통계량이란 요약된 통계 값을 의미합니다. summary() 함수는 데이터를 사전 분석할 때 데이터 특성을 알고자 자주 사용합니다.

> summary(iris)     # iris 모든 열의 요약 통계량을 출력
 Sepal.Length    Sepal.Width   Petal.Length    Petal.Width        Species
Min.   :4.300  Min.   :2.000  Min.   :1.000  Min.   :0.100  setosa    :50
1st Qu.:5.100  1st Qu.:2.800  1st Qu.:1.600  1st Qu.:0.300  versicolor:50
Median :5.800  Median :3.000  Median :4.350  Median :1.300  virginica :50
Mean   :5.843  Mean   :3.057  Mean   :3.758  Mean   :1.199
3rd Qu.:6.400  3rd Qu.:3.300  3rd Qu.:5.100  3rd Qu.:1.800
Max.   :7.900  Max.   :4.400  Max.   :6.900  Max.   :2.500

 

대표적인 요약 통계량은 다음 표와 의미가 같습니다.

 

표 6-9 | 요약 통계량 의미

요약 통계량

의미

설명

Min

최솟값

데이터에서 가장 작은 값

1st Qu

1사분위수

하위 25%의 위치 값

Median

중앙값

50% 중앙의 위치 값

Mean

평균

모든 값을 더해서 개수로 나눈 값

3rd Qu

3사분위수

하위 75%의 위치 값

Max

최댓값

데이터에서 가장 큰 값

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.