더북(TheBook)

켄달의 순위 상관 계수

켄달의 순위 상관 계수Kendal’s Rank Correlation Coefficient[17]는 (X, Y) 형태의 순서쌍으로 데이터가 있을 때 xi < xj, yi < yj 또는 xi > xj, yi > yj가 성립하면 부합, xi < xj, yi > yj 또는 xi > xj, yi < yj면 비부합이라고 정의한다. 즉, x가 커질 때 y도 커지면 부합concordant, x가 커질 때 y가 작아지면 비부합discordant이라고 본다.

켄달의 순위 상관 계수 τ는 다음과 같이 구한다.

(식 7-7)

식 7-7의 분모는 모든 (xi, yi), (xj, yj) 쌍의 수다. 따라서 위 식은 부합쌍이 비부합쌍에 비해 얼마나 많은지 그 비율을 본다. 켄달의 순위 상관 계수는 다른 상관 계수들과 마찬가지로 [-1, 1] 범위를 가지며, 1은 부합 데이터쌍의 비율이 100%임을, -1은 비부합 데이터쌍의 비율이 100%임을 뜻한다. 0은 x와 y 간에 값의 연관성이 없음을 뜻한다.

다음은 c(1, 2, 3, 4, 5)와 c(1, 0, 3, 4, 5) 간에 켄달의 순위 상관 계수를 계산한 예다.

> cor(c(1, 2, 3, 4, 5), c(1, 0, 3, 4, 5), method="kendall")
[1] 0.8
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.