캐글 메달리스트가 알려주는 캐글 노하우: 7.4.8 결과 제출

다시 돌아와서, 당시 2단계 계산 과정이 따로 필요했던 사실과 현재의 Code Competition 같이 룰이 정착되지 않았던 것으로 미루어볼 때, Jigsaw 컴페티션의 상태는 최근에 만들어진 Code Competition처럼 제출 프로세스가 제대로 구성되지 않았던 것으로 생각해볼 수 있습니다. 그 증거로, 지금까지 학습과 추론을 시도했던 테스트 셋(test.csv)은 사실 대회 당시 사용했던 공개 테스트 셋이 아니라 비공개 테스트 셋입니다. 이는 test.csv의 ID 값을 보면 알 수 있습니다. 대회가 끝난 뒤에 정답으로 제공된 test_private_expanded.csv 파일의 ID 순서와 일치하는 것을 확인할 수 있습니다. 제출 시 비공개 점수(Private Score)가 찍히는 것은 이러한 이유 때문입니다. 뿐만 아니라, 서브미션 계산 속도가 도저히 처음부터 재계산된다고 볼 수 없을 정도로 빠릅니다. 자연스럽게 비공개 데이터셋을 추론하도록 만들어 놓고 실제 제출 시에는 재계산 과정 없이 평가 함수 계산만 수행해서 결과를 내놓는 형태로 만들어져 있는 것입니다.

정리하면, 현재 Jigaw 컴페티션은 Code Competition으로 되어 있기는 하나 실제로는 test.csv가 편의상 비공개 테스트 셋으로 대체됐고, 제출 시 재계산 없이 점수만 계산돼서 출력하는 형태라고 요약할 수 있습니다. 그렇다 보니 공개 점수는 나오지 않는 것입니다. 7.4.7절에서 언급한, 미리 전처리한 test.tfrecord로도 제출할 수 있는 이유 역시 재계산하지 않기 때문입니다.

추천 도서와 신규 콘텐츠를 먼저 받아보세요