더북(TheBook)

7. t분포와 t검정

t분포는 정규분포와 모양이 비슷한데, 표본 집단이 소량이라 전체 데이터를 검증할 수 없을 때 사용합니다. 일반적으로 표본 크기가 크면 t분포는 정규분포에 가까워집니다. t검정은 t분포를 이용하여 귀무 가설하에 있을 확률, 즉 실험을 위해 표본 추출한 평균(표본 평균)이 전체 평균(모집단 평균 = 진짜 평균)과 차이가 발생할 확률(유의 확률)을 계산합니다. 차이가 발생할 확률이 유의 수준보다 작으면 귀무 가설을 기각하고, 차이가 발생할 확률이 유의 수준보다 크면 귀무 가설을 기각할 수 없습니다. 헷갈린다고요? 다음 예시를 살펴보면 빠르게 이해할 수 있을 것입니다. 다음은 가설을 세우고 t검정을 진행하는 예시입니다.

귀무 가설: 전체 몸무게 평균은 65kg이다.

대립 가설: 전체 몸무게 평균은 65kg이 아니다.

test1 <- c(58, 70, 82, 65, 72, 82, 68, 70, 63)     # 표본 집단
t.test(test1, mu = 65)                             # t-test-----
       One Sample t-test

data:  test1
t = 1.8713, df = 8, p-value = 0.0982
alternative hypothesis: true mean is not equal to 65
95 percent confidence interval:
 63.83866 76.16134
sample estimates:
mean of x
       70

*t검정 함수. mu는 검정하고자 하는 평균값

* 유의 확률 0.098(9.8%)

* 평균 70

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.