더북(TheBook)

(1) 문제 해결이 필요하게 된 배경은 무엇인가?

컴페티션의 문제가 발생한 배경(Background)을 이해하는 것이 문제 정의를 위한 근거를 찾는 데 도움이 됩니다. 이 과정을 진행하면서 자연스럽게 문제와 관련한 도메인 지식을 공부하게 됩니다. 문제 정의를 잘 하기 위해서는 도메인에 대해 이해하고, 데이터의 특성을 잘 파악하는 것이 무엇보다 중요합니다.

EDA(Exploratory Data Analysis: 탐색적 데이터 분석)를 하는 이유는 이를 파악하고 문제 정의 내용이 합당한 것인가를 확인하려는 목적이 큽니다. EDA와 문제 정의를 반복하면서 내가 풀어야 할 문제를 점점 구체화할 수 있습니다.

배경 정보를 가장 잘 설명하는 곳이 바로 Overview 페이지입니다. Overview의 내용을 토대로 도메인 지식과 관련한 정보를 수집하고 컴페티션을 전체적으로 이해하는 과정을 거치면서 문제를 정의할 기반을 만드는 것이 이 단계에서 해야 할 일입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.