더북(TheBook)

6.4.4 평가 척도

다음은 도출한 연관 규칙을 평가하는 세 가지 척도입니다.

지지도

신뢰도

향상도

하나씩 살펴봅시다.

 

지지도

지지도(support)는 해당 패턴이 데이터셋에서 얼마나 자주 등장하는지 나타냅니다. 이는 대상 규칙의 발생 빈도를 전체 거래 기록의 개수로 나누어 구합니다.

어떤 아이템 세트 itemseta를 예로 들어 보겠습니다.

numItemseta = itemseta가 포함된 거래 기록 개수

numtotal = 전체 거래 기록 개수

support(itemseta) =

주의 ≡

지지도를 보면 해당 패턴이 얼마나 희귀한지 알 수 있습니다. 패턴이 낮은 지지도는 희귀합니다.

예를 들어, 전체 6개의 거래 중 itemseta = {helmet, ball}이 등장하는 거래 기록이 2건이라면 지지도(itemseta) = 2/6 = 0.33입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.