더북(TheBook)

5.5.3 요약 통계 계산

주어진 데이터셋을 한눈에 파악하려면 요약 통계가 필요하다. R은 수치형 벡터에서 평균, 중간 값, 표준 편차, 분산, 최댓값, 최솟값, 범위, 사분위 값을 포함하는 요약 통계를 계산하는 함수를 제공한다. 다중 수치형 벡터는 공분산 행렬과 상관 행렬을 계산할 수 있다.

다음 코드는 내장 함수를 사용하여 이러한 요약 통계를 계산하는 방법을 보여 준다. 먼저 표준 정규 분포에서 길이가 50인 난수 벡터를 생성한다.

> x <- rnorm(50)

mean() 함수는 x의 평균을 계산한다.

> mean(x)
[1] -0.1051295

이는 다음 코드와 동일하다.

> sum(x) / length(x)
[1] -0.1051295
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.