더북(TheBook)

2 모집단분포와 확률표본

 

모집단과 모수

모집단은 어떤 통계적 실험의 대상이 되는 모든 대상물입니다. 즉, 연구 대상(학생들의 수학 평균 점수를 조사하고 싶다)을 구성하는 모든 데이터(모든 학생의 수학 점수)라고 이해하면 됩니다. 이때 모집단을 구성하는 데이터가 이루는 확률분포가 모집단분포(population distribution)입니다.

 

모수(parameter)는 모집단의 특성을 나타내는 수치로 모평균, 모분산, 모표준편차, 모비율, 모상관관계 등이 있습니다. 다시 말해 모수란 모집단을 구성하는 데이터를 설명하는 수치 값이라고 할 수 있습니다. 모수가 중요한 이유는 우리가 실제로 알고 싶어 하는(추정하고 싶어 하는) 것은 ‘모집단 데이터’가 아니라 ‘모집단 특성을 설명하는 모수’이기 때문입니다. 예를 들어 우리는 수학 점수 전체 데이터(모집단)를 알고 싶은 것이 아니라 전체 수학 점수의 평균(모평균) 또는 전체 수학 점수의 표준편차(모표준편차)를 알고 싶기 때문입니다. 모집단의 특성을 간략하게 설명하는 데는 모수가 가장 효율적입니다.

 

문제는 대부분의 모집단 분포는 완전하게 알려진 것이 없습니다. 예를 들어 방법 A로 학습한 그룹과 방법 B로 학습한 그룹 중 어느 그룹의 수학 점수가 높을까요? 모집단이 추상적이기 때문에 완전한 데이터를 얻을 수 없으며, 얻을 수 있더라도 경제적·공간적·시간적 제약으로 거의 불가능합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.