더북(TheBook)

표본집단의 분산도 마찬가지다. 특히 표본집단의 분산 계산에 사용한 평균은 모집단의 평균이 아니다. 이러한 오차를 일부 보정하기 위해 N - 1로 나눠준다. 수학적으로 말하면, 데이터가 표본집단일 때 N - 1로 편차 제곱합을 나눠야 모집단 분산에 대한 불편추정량(unbiased estimator)이 되기 때문이다.

N - 1을 자유도(degree of freedom)라고 한다. 자유도는 자유롭게 움직이는 정도라는 의미인데, 가령 합계가 알려져 있을 때 다섯 개의 숫자 중 네 개를 자유롭게 고르고 나면 나머지 하나는 자유롭게 고르지 못하고 합계와 일치하기 위해 고정된다. 따라서 자유도가 4다.

▲ 그림 1-34 스도쿠에서 자유롭게 숫자를 채우다 보면 어쩔 수 없이 맘대로 채울 수 없는 칸이 생긴다

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.