더북(TheBook)

6.1.1 데이터 마이닝 사이클에서의 비지도 학습

데이터 마이닝 프로세스의 전반적인 라이프 사이클을 살펴보면 비지도 학습의 역할을 이해할 수 있습니다. 데이터 마이닝 프로세스를 단계(phases)라 부르는 독립적인 부분으로 쪼개는 방법에는 여러 가지가 있습니다. 그 중 인기 있는 두 가지 방법은 다음과 같습니다.

CRISP-DM(Cross-Industry Standard Process for Data Mining) 라이프 사이클

SEMMA(Sample, Explore, Modify, Model, Access) 데이터 마이닝 프로세스

CRISP-DM은 크라이슬러(Chrysler), SPSS(Statistical Package for Social Science) 등 여러 회사에 속한 데이터 마이너 전문가들이 개발하고, SEMMA는 SAS(Statistic Analysis System)가 제안했습니다. 이 절에서는 CRISP-DM을 통해 데이터 마이닝 사이클에서 비지도 학습이 어떤 역할을 수행하는지 알아보겠습니다. 참고로 SEMMA의 라이프 사이클도 비슷한 단계들로 구성되어 있습니다.

CRISP-DM 라이프 사이클은 여섯 단계로 구성되어 있습니다.

▲ 그림 6-2 CRISP-DM 라이프 사이클

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.