6.2.2 다중 비교
앞에서 살펴본 바와 같이 분산분석을 통해서 집단별 평균의 차이가 유의미한지를 검정할 수 있었다. 이 결과를 활용해서 더 필요한 정보는 과연 어느 집단 사이에 평균의 차이가 통계적으로 유의한지를 알 수 있느냐일 것이다. 이를 위해서 다중 비교(multiple comparison)를 사용한다. 즉, 분산분석에서는 한 요인에서 여러 수준으로 나누고 수준별 평균의 차이를 검정한다. 검정 결과에서 귀무 가설을 기각하는 경우에 요인 수준별 평균이 같지 않다는, 즉 차이가 있다는 결론을 내리게 된다. 이때 어떤 요인의 수준 간 차이로 인해 이러한 결과가 나왔는지를 파악하고 싶을 때 사용하는 것이 다중 비교이다.
다중 비교를 하려면 쌍체 t 검정, 투키 HSD 검정(Tukey’s HSD test)을 사용할 수 있다. 하지만 쌍체 t 검정은 1종 오류(True임에도 False로 판단하는 오류임을 기억하자)의 가능성이 높으므로 투키 HSD 검정을 사용하기 권장한다.
투키 HSD(Honestly Significant Difference) 검정은 스튜던트화 범위 분포(studentized range distribution)2를 바탕으로 모든 두 집단의 평균 차이를 검정한다. 두 집단의 평균 차이가 없다고 귀무 가설을 고려하여 HSD 검정 결과로 나오는 p값을 통해 귀무 가설의 기각 여부를 판단한다.
표 6-3은 다중 비교 결과를 보여준다. 이 결과에서 *는 유의한 평균의 차이임을 의미한다. 그룹 1과 2, 그룹 1과 3은 유의한 평균 차이를 제시하는 반면에 그룹 2와 3의 평균 차이인 -0.59는 유의하지 않음을 볼 수 있다.
▼ 표 6-3 다중 비교 예시
그룹 1 |
그룹 2 |
그룹 3 |
|
그룹 1 |
- |
12 *** |
- 5 *** |
그룹 2 |
|
- |
- 0.59 |
그룹 3 |
|
|
- |
2 t 분포와 비슷하며 스튜던트화 범위인 q값의 분포를 나타내는데, q는 비교하려는 두 집단 평균의 차이가 최대인 값을 두 집단의 표준편차로 나눠 얻고, 통계량의 역할을 하는 q는 HSD 검정에 사용된다.