7. t분포와 t검정
t분포는 정규분포와 모양이 비슷한데, 표본 집단이 소량이라 전체 데이터를 검증할 수 없을 때 사용합니다. 일반적으로 표본 크기가 크면 t분포는 정규분포에 가까워집니다. t검정은 t분포를 이용하여 귀무 가설하에 있을 확률, 즉 실험을 위해 표본 추출한 평균(표본 평균)이 전체 평균(모집단 평균 = 진짜 평균)과 차이가 발생할 확률(유의 확률)을 계산합니다. 차이가 발생할 확률이 유의 수준보다 작으면 귀무 가설을 기각하고, 차이가 발생할 확률이 유의 수준보다 크면 귀무 가설을 기각할 수 없습니다. 헷갈린다고요? 다음 예시를 살펴보면 빠르게 이해할 수 있을 것입니다. 다음은 가설을 세우고 t검정을 진행하는 예시입니다.
• 귀무 가설: 전체 몸무게 평균은 65kg이다.
• 대립 가설: 전체 몸무게 평균은 65kg이 아니다.
test1 <- c(58, 70, 82, 65, 72, 82, 68, 70, 63) # 표본 집단 t.test(test1, mu = 65) # t-test----- One Sample t-test data: test1 t = 1.8713, df = 8, p-value = 0.0982 alternative hypothesis: true mean is not equal to 65 95 percent confidence interval: 63.83866 76.16134 sample estimates: mean of x 70
*t검정 함수. mu는 검정하고자 하는 평균값
* 유의 확률 0.098(9.8%)
* 평균 70