더북(TheBook)
  • 사각형 1의 경우 ○에서 xy 값이 평균 μ보다 크므로 (x - μx)(y - μy) > 0이다.
  • 사각형 2의 경우 ○에서 x는 평균보다 작고 y는 평균보다 크므로 (x - μx)(y - μy) < 0이다.
  • 사각형 3의 경우 ○에서 x는 평균보다 작고 y도 평균보다 작으므로 (x - μx)(y - μy) > 0이다.
  • 사각형 4의 경우 ○에서 x는 평균보다 크고 y는 평균보다 작으므로(x - μx)(y - μy) < 0이다.

공분산에서 중요한 것은 부호뿐이다. 공분산이 (+)이면 xy는 양의 상관관계다. x가 증가하면 y도 증가한다는 의미다. 반대로 공분산이 (-)이면 xy는 음의 상관관계다. x가 증가하면 y는 감소한다는 의미다. 이처럼 공분산은 xy 변수 간의 방향성을 알려주지만 상관관계의 정도를 구체적으로 표현하지는 못한다.

상관관계를 표준화한 값이 상관계수다. 표준화됐기 때문에 상관계수는 (-1) ~ (+1) 사이이므로 상관관계 비교가 가능하다. 상관계수는 ρ(rho)라고 표시하는데, 공식은 다음과 같다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.