더북(TheBook)

신뢰도

신뢰도(confidence)는 조건부 확률을 이용해 왼편(X)과 오른편(Y)을 얼마나 강하게 연관 지을 수 있을지 정량화한 척도입니다. 이는 이벤트 X가 발생했을 때 XY로 이어질 확률을 뜻합니다.

XY라는 규칙을 예로 들어 보겠습니다.

이 규칙의 신뢰도는 confidence(XY)입니다. 이는 다음과 같이 계산합니다.

confidence(XY) =

다음과 같이 규칙의 신뢰도를 구해 봅시다.

{helmet, ball} ⇒ {wickets}

신뢰도 공식을 적용합니다.

이는 곧 어떤 사람이 {helmet, ball}을 장바구니에 담고 있다면 0.5 또는 50%의 확률로 wickets도 담고 있을 것이라는 의미입니다.

 

향상도

규칙의 품질을 측정하는 또 다른 방법은 향상도(lift)입니다. 향상도는 무작위로 Y를 예측하는 것에 비해 주어진 조건 X를 이용한 예측의 개선 효과가 얼마나 더 큰지 표현합니다. 향상도 공식은 다음과 같습니다.

Lift(XY) =

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.