더북(TheBook)

둘째, 컴퓨터 사양에 따라 퍼포먼스가 달라질 수 있습니다. 컴페티션을 진행하는 다른 캐글러의 솔루션을 보면 계산이 오래 걸리는 모델을 사용하고 심지어 여러 모델을 앙상블하여 솔루션을 만드는 경우도 더러 있습니다. 아주 약간의 차이로 순위가 결정되는 경쟁이다 보니 최대한 많은 실험을 토대로 적절히 앙상블할수록 높은 순위에 도달할 확률이 높아집니다. 그에 따라 많이 실험하고 제출하기 위한 컴퓨터 자원을 가진 사람이 우세할 수밖에 없습니다.

셋째, 파이썬 코드나 머신러닝, 딥러닝 관련 라이브러리의 코드를 이해하고 다루는 게 아직 익숙하지 않은 경우 컴페티션을 따라가기 어렵습니다. 컴페티션에는 많은 코드와 자료가 공유되지만 정작 자신이 그 코드를 이해할 수 없다면 당연히 활용할 수도 없습니다. 특히 컴페티션을 목적으로 만든 노트북 자료들이므로 나에게 부족한 점을 가르쳐줄 친절한 코드가 아닐 확률이 높습니다.

마지막으로, 가장 중요한 문제는 처음 컴페티션을 맞닥뜨렸을 때 무엇을 해야 할지, 어떻게 시작해야 할지 잘 모르는 경우가 많다는 것입니다. 누구나 처음에는 다른 캐글러의 코드를 필사해보다가 한번 제출하는 데까지는 시도할 수 있습니다. 하지만 여기에 계속 얽매여 있다 보면 시간이 지날수록 동기 부여가 되지 않고, 결국 남는 게 없이 잊혀지는 경우가 허다합니다.

이러한 이유로 초보 캐글러 대부분은 애써 컴페티션에 참가해도 시간을 투자한 만큼 자신에게 좋은 공부가 되었다거나 실력 향상에 도움이 되는 등 좋은 경험을 하는 경우가 생각보다 많지 않습니다. 과연 초심자에게 컴페티션은 정말로 아무런 도움도 안 되는 것일까요? 여기에 대한 나름의 팁을 소개합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.