전형적인 슈퍼마켓 사례를 하나 들어 보겠습니다. 이 슈퍼마켓에 진열된 아이템들(중복 제외)을 π = {item1, item2, ..., itemm}라고 하겠습니다. 만약 여기서 판매하는 아이템의 개수가 500개라면 π의 크기도 500이 됩니다.
고객들이 슈퍼마켓에서 아이템을 골라서 카운터에서 계산할 때마다 아이템 세트(itemset)에 추가합니다. 거래 기록을 일정 기간 동안 모은 거래 데이터를 △ = {t1, t2, ..., tn}이라고 하겠습니다.
다음은 4개의 거래 기록으로 이루어진 간단한 거래 데이터입니다. 각 거래 기록은 다음과 같습니다.
▼ 표 6-3 거래 기록 예시
t1 |
wickets(크리켓 위켓), pads(다리 보호대) |
t2 |
bat(방망이), wickets, pads, helmet(헬멧) |
t3 |
helmet, ball(공) |
t4 |
bat, pads, helmet |
이 슈퍼마켓에서 판매하는 아이템의 종류는 π = {bat, wickets, pads, helmet, ball}입니다.
거래 데이터 △에 담긴 거래 기록 t3를 살펴봅시다. t3는 itemsett3 = {helmet, ball}입니다. 이 고객은 두 개의 아이템을 구매했군요. 이 아이템 세트에는 두 개의 아이템이 담겨 있기 때문에 그 크기는 2입니다.