더북(TheBook)

전형적인 슈퍼마켓 사례를 하나 들어 보겠습니다. 이 슈퍼마켓에 진열된 아이템들(중복 제외)을 π = {item1, item2, ..., itemm}라고 하겠습니다. 만약 여기서 판매하는 아이템의 개수가 500개라면 π의 크기도 500이 됩니다.

고객들이 슈퍼마켓에서 아이템을 골라서 카운터에서 계산할 때마다 아이템 세트(itemset)에 추가합니다. 거래 기록을 일정 기간 동안 모은 거래 데이터를 △ = {t1, t2, ..., tn}이라고 하겠습니다.

다음은 4개의 거래 기록으로 이루어진 간단한 거래 데이터입니다. 각 거래 기록은 다음과 같습니다.

▼ 표 6-3 거래 기록 예시

t1

wickets(크리켓 위켓), pads(다리 보호대)

t2

bat(방망이), wickets, pads, helmet(헬멧)

t3

helmet, ball(공)

t4

bat, pads, helmet

이 슈퍼마켓에서 판매하는 아이템의 종류는 π = {bat, wickets, pads, helmet, ball}입니다.

거래 데이터 △에 담긴 거래 기록 t3를 살펴봅시다. t3는 itemsett3 = {helmet, ball}입니다. 이 고객은 두 개의 아이템을 구매했군요. 이 아이템 세트에는 두 개의 아이템이 담겨 있기 때문에 그 크기는 2입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.