이표본 비율
이표본 비율은 두 집단에서 표본을 추출해 표본의 비율을 보고 모집단에서의 비율을 비교하는 경우다. 예를 들어, 남성의 흡연율과 여성의 흡연율에 차이가 있는지를 비교하기 위해 남성 100명, 여성 100명의 흡연율을 계산하고 이로부터 남성의 흡연율과 여성의 흡연율에 차이가 있는지 가설 검정하는 경우를 생각해볼 수 있다.
이론적 배경
독립인 두 집단 X, Y가 이항 분포를 따른다고 하자.
n이 충분히 클 때 X, Y가 근사적으로 정규 분포를 따른다. 식 7-12를 X, Y에 적용하고 비율의 차를 구하면 그 역시 정규 분포를 따른다.
따라서 p1-p2의 95% 신뢰 구간은 α=0.05라 할 때 다음과 같다.
추정 및 검정의 예
두 개의 동전을 각각 100회, 90회 던졌을 때 각각 앞면이 45회, 55회 나왔다고 하자. 이때 두 동전의 앞면이 나올 확률이 같은지 검정해보자.
> prop.test(c(45, 55), c(100, 90))
2-sample test for equality of proportions with continuity correction
data: c(45, 55) out of c(100, 90)
X-squared = 4.3067, df = 1, p-value = 0.03796
alternative hypothesis: two.sided
95 percent confidence interval:
-0.31185005 -0.01037217
sample estimates:
prop 1 prop 2
0.4500000 0.6111111
p < 0.05가 나와 두 동전의 앞면이 나올 확률이 같다는 가설을 기각한다. 즉, 두 동전의 앞면이 나올 확률은 서로 다르다.