더북(TheBook)

7.1 얇고도 깊은 분석의 목적

우리는 지금까지 데이터를 이해하는 데 필요한 수리적 배경에 대해 살펴보았다. 앞서 이해한 주요 개념을 바탕으로 이제 본격적인 데이터 분석에 대해 소개하고자 한다. 우선, 데이터 분석의 의미를 다시 살펴보면 ‘데이터’란 우리가 관심을 갖는 어떤 사건이나 현상에 대한 과거의 기록이다. 실시간에 가깝다 하더라도 데이터로 만들어진 순간 ‘과거’의 기록이 되는데, 이 데이터를 분석한다면 우리가 관심을 갖는 주요 사건이나 현상의 ‘과거’를 이해할 수 있다. 그리고 과거에 대한 이해를 바탕으로 앞으로 일어날 일도 조심스럽게 예측할 수 있을 것이다. 이처럼 데이터 분석에서는 추론과 예측이 매우 중요하다.

▲ 그림 7-1 데이터 분석의 목적

만약 추론과 예측을 모두 잘하는 기법이 있다면 답은 너무나 분명하다. 모두가 그 기법만 이해하고 사용하면 되는 것이다. 하지만 현재까지 우리가 사용하는 모든 기법은 추론과 예측 중에 한 쪽에만 강점이 있다. 요즘 많이 접하는 딥러닝은 예측에 강하다. 반면 셸로우 러닝(Shallow Learning)이라고도 불리는 유형의 기법들, 특히 선형 회귀 분석은 추론에 강하다. 데이터를 분석하는 목적이 무엇인지에 따라 어떤 방식의 기법을 선택하는지가 정해진다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.