해석과 평가
분석 결과의 ‘해석과 평가’를 통해 의미를 도출해 내고 반영합니다. 이 과정에서는 근거를 통한 분석가의 주관이 포함될 수 있습니다. ‘온라인에서도 사업성이 충분히 높을 것이다, 직장인들이 타깃 고객이 될 수 있다, 스테이크의 상품 특성을 고려한 신 메뉴 상품을 만들어야 한다’ 등의 논리가 이러한 과정을 통해 도출되었습니다. 이 과정에서는 보고자에게 의미를 쉽게 전달하기 위해 데이터를 그림과 도표로 이해하기 쉽게 표현하는 데이터 시각화 작업을 진행하기도 합니다. 12장 실습에서 살펴본 각종 그래프가 데이터 시각화에 해당합니다.
이처럼 데이터 분석은 여러 과정을 거치며, 결과는 분석가의 재량과 판단에 따라 달라질 수 있습니다. 즉, 최분석 과장과 김힘찬 부장이 내린 분석에 대한 결론 말고도 얼마든지 다르게 해석할 수 있고 결과도 달라질 수 있습니다. 어느 하나의 데이터에서 의미 있는 결과를 도출한다기보다는 다양한 데이터를 유기적으로 연결하여 진정한 의미를 도출해야 하는 것이 데이터 분석가의 사명입니다.
혹자는 대용량 데이터 통계 분석이나 빅데이터 활용의 중요성을 먼저 강조하는데, 이것은 가장 기본이 되는 데이터와 데이터가 모여 있는 데이터베이스가 잘 정리되고 관리되고 있다는 것이 전제 조건입니다. 기본 데이터가 관리되지 않은 상태에서 높은 단계의 데이터 분석과 활용은 사상누각입니다. 고도의 분석 기술을 논하기 전에 기본 데이터의 조작과 분석을 얼마나 잘 하고 있는지 돌아볼 필요가 있습니다.