더북(TheBook)

각각의 거래에는 중복되지 않는 ID가 있어야 한다. ID는 정보를 수집하는 규칙을 따른다. 이런 종류의 규칙이 가치 있는 무언가를 만들려면 수백 건의 거래 정보가 필요하다. 거래 집합이 클수록 통계 결과는 더 좋고, 예측은 더 훌륭해질 것이다.

규칙은 함축(implication)으로 정의되며, 다음과 같다.

 

수식이 아니라 말로 쉽게 이야기하면, X와 Y는 X와 Y의 교집합으로 이루어진 아이템 집합 I의 하위 집합이다.

X와 Y는 X와 Y로 표시된 아이템처럼 집합의 형태를 취하고 있다. 무시무시한 수학 책에서는 다음과 같다.

 

X는 함축 기호 앞 아이템 집합을 표시한 것으로 전건(명제의 조건적 요소, antecedent)이라고 한다. Y는 규칙 뒤 아이템 집합을 가리키며, 후건(조건 진술문의 결과, consequent)이라고 한다.

기본 아이템 집합 내 제품으로 돌아가서,

 

(true)/거짓(false) 항목은 아이템의 구매 여부를 나타낸다.

연관 규칙이 어떻게 작동하는지 보려면 지지도, 신뢰도, 향상도, 확신도에 대해 더 알아야 한다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.