더북(TheBook)

mean() 함수는 평균을 계산할 때 입력 데이터의 양 끝에서 일정 비율의 데이터를 잘라 낸다.

> mean(x, trim = 0.05)
[1] -0.141455

다른 값들과 멀리 떨어져 있는 특이 값들이 x에 있다면 방금 소개한 방법을 활용하여 입력 값에서 특이 값들을 지울 수 있기 때문에 이렇게 구한 평균값이 좀 더 강인(로버스트)하다1고 할 수 있다.

표본 데이터 위치를 나타내는 또 다른 측정 방법은 표본 중간 값이다. 표본 데이터가 주어졌을 때 관측 값의 절반은 중간 값보다 크고, 나머지 절반은 중간 값보다 작다. 데이터에 극단 값이 있더라도 중간 값은 강인한 측정치다. x에 대한 표본 중간 값은 다음과 같다.

> median(x)
[1] -0.2312157

평균이나 중간 값 같은 위치 추정과 더불어 변이 추정 역시 중요하다. 표준 편차를 계산하는 데 sd() 함수를 사용한다.

> sd(x)
[1] 0.8477752

 

 


1 역주 ‘강인하다’는 외부의 노이즈나 불확실한 외란에도 안정성을 확보할 수 있다는 의미다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.