더북(TheBook)

둘째, 캐글 초심자가 잘못된 길로 들어서는 원인이 될 수 있습니다. 점수가 높을수록 컴페티션 순위가 올라가는 것은 캐글이 처음인 사람이라도 쉽게 알 수 있습니다. 여기서 문제가 되는 부분은 자칫 ‘점수를 올리는 것만이 컴페티션의 목표’라는 인식을 심어줄 수 있다는 점입니다. 다시 말해 몇몇 초심자 입장에서는 문제 설정 및 개발의 앞뒤 준비 과정을 모두 생략하고 오로지 ‘점수를 올리려면 어떻게 해야 할까?’부터 떠올리게 됩니다. 어느 정도 데이터 사이언스에 숙련된 사람이라면 자신만의 기준으로 이에 휘둘리지 않을 수 있습니다. 하지만 경험이 부족한 경우라면 그저 추상적으로 정의된 목표 달성을 위해 결과만 좇으려고 할 것이고, 결국 앞서 소개한 ‘잘못된 필사’로 빠질 가능성이 높아집니다.

이와 같이 컴페티션의 점수 시스템은 캐글러를 때로는 응원하기도 하고 때로는 실망시키기도 하는 양면성을 지닙니다.

그렇다면 컴페티션에 어떤 자세로 임해야 할까요?

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.