더북(TheBook)

3. 분산

각 편차 값을 제곱해 보겠습니다. 이렇게 하면 음수(-, 마이너스) 편차 값들이 모두 양수(+, 플러스) 값으로 바뀌기 때문에 모두 더해도 0이 나오지 않습니다.

 

표 3 | 제곱 편차 구하기

이름

편차(A)

제곱 편차(A^2)

최준호

8

64

김주찬

0

0

이상윤

-5

25

이두희

-7

49

최대호

4

16

 

구한 제곱 편차의 평균값을 구해 보겠습니다.

 

(64 + 0 + 25 + 49 + 16) / 5 = 30.8

 

각 편차를 제곱해서 나온 값들의 평균을 구했더니 30.8이 나왔습니다. 이 값을 분산(variance)이라고 합니다. 다만 통계의 표본 분산을 구할 때는 ‘데이터 개수 - 1’, 즉 ‘(n-1)’로 나눈다고 알아 둡니다.9

 

(64 + 0 + 25 + 49 + 16) / (5-1) = 38.5

 

분산은 분산된 정도를 알려 주는 값입니다. 하지만 분산 값은 편차를 모두 더했을 때 0이 나오는 현상을 없애기 위한 값이므로, 우리가 알고자 하는 ‘편차의 평균’이라고 할 수는 없습니다. 그러면 어떻게 해야 할까요? 앞서 각 편차를 제곱한 후 평균을 구했으므로, 이번에는 반대로 루트를 적용하면 됩니다.

 

 


9 자세히 알고 싶다면 통계 분산과 ‘자유도’에 대해 알아보세요.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.