더북(TheBook)

1.5.6 자유도

분산 또는 표준편차를 계산할 때는 데이터가 모집단(population)인지 또는 표본(sample)인지에 따라 계산이 약간 달라진다. 분산과 표준편차의 식(사실상 하나이지만)을 보면, 분자와 분모로 나눠진 나눗셈이다.

분산 = 편차 제곱합 / 데이터의 개수(N)

편차 제곱합 = Σ(데이터 - 평균)2

편차 제곱합인 분자 부분의 식은 그대로인데, 데이터의 개수인 분모는 데이터가 모집단인지 표본집단인지에 따라 달라진다. 즉, 데이터의 개수가 N이라고 할 때 모집단인 경우 분모는 N이고, 표본집단인 경우 N - 1이다.

표본분산 = 편차 제곱합 / 표본 데이터의 개수(N - 1)

편차 제곱합 = Σ(표본 데이터 - 표본평균)2

정확한 통계량을 구하기 위한 가장 좋은 방법은 모든 대상을 상대로 데이터를 구하는 것이다. 이 모든 대상을 모집단이라고 한다. 그러나 조사를 할 때마다 모집단을 상대로 데이터를 구하려면 현실적인 문제가 있다. 비용 문제도 있지만 아예 불가능한 경우도 있기 때문이다.

따라서 모집단의 일부만을 대상으로 데이터를 구한다. 모집단의 일부를 표본집단이라고 한다. 전체가 아닌 일부이므로 통계량이 정확하지는 않다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.