다음 예처럼 성인 남매의 키에 대해 상관분석을 하는 경우를 살펴보자.
▲ 그림 6-2 상관분석의 예시
우선, 모집단에서 성인 남매의 키 값들 사이에는 어떤 관계가 존재할 것이고, 우리는 이를 모수로 볼 수 있다. 그러나 모수를 알기 위해서는 전세계 모든 성인 남매의 키 값이 필요한데, 현실적으로 어려우니 그림 6-2처럼 남매 11쌍을 표본으로 하여 값을 측정하였다. 여기서 남매 키의 상관관계는 0.558이 나왔으며, 이 값은 모수를 추정하는 통계량이다. 이때 상관관계에 대한 가설 검정은 다음과 같이 이뤄진다.
- 귀무 가설: 성인 남매의 키 사이에는 상관관계가 없다.
- 대립 가설: 성인 남매의 키 사이에는 상관관계가 있다.
그리고 이때 p값은 0.074가 나왔는데 유의 수준을 5%라고 한다면 귀무 가설을 기각할 수 없다. 귀무 가설이 참인 경우에 대한 확률인 p값이 우리가 정한 기준인 5%보다 크기 때문이다. 만약 p값이 유의 수준 5%보다 작게 나왔다면 귀무 가설을 기각하고, 데이터를 통해 알고자 했던 성인 남매의 키 사이에는 선형적인 상관관계가 있다는 새로운 지식을 받아들일 수 있다.