②-1 가설 수립: 문제를 해결하기 위해 원인을 유추해서 가설을 세우는 단계입니다. 예를 들어 ‘SNS 마케팅 캠페인에 따른 고객 유입이 많을 것이다’라든가 ‘웹 사이트 결제 단계에 문제가 있을 것이다’ 등이 있습니다.
②-2 데이터 처리: 가설을 검증하기 위해 데이터를 수집하고 가공하고 정리하는 과정입니다. 이 단계에서는 원천 데이터를 모으고 표준화해서 검증할 수 있는 형태로 정리합니다. 이를 전처리라고도 부르는데, 온라인 분석에서 이 과정은 구글 애널리틱스가 맡습니다. 하지만 오프라인 데이터 분석에서는 분석가가 SQL, 파이썬, R 등 분석 도구 등을 이용해서 데이터를 직접 처리해야 하는 경우가 많습니다.
②-3 가설 검증: 처리된 데이터를 기반으로 가설이 맞는지를 검증합니다. 이 단계에서는 앞서와 마찬가지로, 다양한 분석 도구를 이용해서 데이터 마이닝이나 통계적 과정을 거쳐 검증하기도 합니다. 하지만 ‘SNS 마케팅 캠페인 효과로 인한 고객 유입이 정말 많았는가?’, ‘웹 사이트 결제 단계에서 고객이 이탈이 많았는가?’와 같은 간단한 가설에 대해서는 기본 지표 항목만으로 검증할 수도 있습니다.
③ 결과 실행: 검증된 가설을 기반으로 결과를 실행합니다. 예를 들어 ‘SNS 마케팅 캠페인으로 유입된 고객이 많았기 때문에 SNS 마케팅 캠페인을 주로 실행한다’ 등이 있습니다. 가설이 맞지 않았을 수도 있고, 분석 결과가 명확하지 않을 수도 있습니다. 이런 경우에는 다시 가설을 세워 데이터 분석을 진행합니다.