5.6.4 등분산 검정: F 검정
등분산 검정(test of equal variances)은 두 집단 혹은 세 집단 이상 사이에 산포도(대표적인 산포도로 분산이 있음) 차이가 있는지를 통계적인 방법으로 검정하는 것으로, 두 집단 이상의 분산 차이를 검정할 때 사용할 수 있다. 즉, 각 집단이 갖는 분산이 같은 것을 귀무 가설로, 차이가 있는 것을 대립 가설로 하여 검정하는 방법이다.
- 귀무 가설(H0): σ12 = σ22=… = σn2(모집단 간의 분산은 같다.)
- 대립 가설(H1): σi2 ≠ σj2(모집단 간의 분산은 다르다.)
등분산 검정 결과, 귀무 가설이 기각되면 집단 간의 분산은 같지 않음을 말할 수 있다. 등분산 검정에는 자료가 정규 분포를 따르는 경우, F 검정(두 집단 분산 비교)과 바트렛(Bartlett) 검정(세 집단 이상 분산 비교)을 사용할 수 있다. 정규 분포를 따르지 않으면 레빈(Levene) 검정을 사용할 수 있다. 특히, F 검정(F test)은 두 집단 간에 분산의 차이가 있는지를 통계적인 방법으로 검정하며 회귀모형 해석 등에도 많이 사용된다.
예를 들어 보자. 어떤 지역에서 동일한 제품을 판매하고 직원 수도 동일한 두 가게를 가정하였다. 두 가게가 포함된 상권을 조사하는 과정에서, 두 가게의 일별 매출의 변동을 통해 상권을 이해하고자 한다. 같은 지역에서 객관적인 조건이 같은 두 가게인데, 과연 이 두 곳의 일별 매출 값의 분산은 같을까 아니면 다를까? 우리는 등분산 검정, 그중에서도 F 검정을 통해 이를 분석할 수 있다. 두 가게의 매출 값에 대해서 다음과 같이 가설을 세워보자.
- 귀무 가설(H0): σ12 = σ22(두 가게의 매출 값의 분산은 같다.)
- 대립 가설(H1): σ12 ≠ σ22(두 가게의 매출 값의 분산은 다르다.)
F 검정의 결과, 귀무 가설이 기각된다면 우리는 객관적으로 동일한 조건을 갖는 두 가게의 매출 값 분산이 통계적으로 다르다고 할 수 있다. 그리고 왜 이런 차이가 생겼는지에 대해 더 고민할 수 있다.