더북(TheBook)

6.4.5 연관 규칙 마이닝 알고리즘

이 절에서는 연관 규칙 마이닝에 사용하는 두 가지 알고리즘을 알아보겠습니다.

Apriori 알고리즘: 1994년에 아그라왈(Agrawal, R)과 스리칸트(Srikant)가 제안했습니다.

FP-growth 알고리즘: 2001년에 한(Han) 등이 제안한 더 개선된 알고리즘입니다.

하나씩 자세히 알아봅시다.

 

Apriori 알고리즘

Apriori 알고리즘은 여러 단계를 반복적으로 실행하여 연관 규칙을 생성합니다. 이 알고리즘은 생성과 테스트(generation-and-test) 접근 방식을 취합니다.

Apriori 알고리즘을 실행하기 전에 먼저 두 가지 변수를 정의해야 합니다. 하나는 supportthreshold이며 다른 하나는 Confidencethreshold입니다.

이 알고리즘은 두 단계로 구성됩니다.

후보 생성 단계: 후보 아이템 세트를 여럿 생성합니다. 이 아이템 세트들의 지지도는 supportthreshold를 넘어야 합니다.

필터링 단계: Confidencethreshold보다 신뢰도가 낮은 규칙을 제거합니다.

필터링을 거치고 남은 규칙이 알고리즘의 결과가 됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.