더북(TheBook)

캐글은 Usability를 높일 수 있는 가이드를 제공합니다. 내 데이터셋 인터페이스의 ‘Pending Actions’ 부분에 가이드가 있습니다. 이를 잘 따라만 해도 Usability가 높아지므로 누구나 좋은 데이터셋을 만들 수 있습니다.

▲ 그림 1-41 Pending Actions

공개 데이터셋을 제외하면, 데이터셋을 만드는 것은 대부분 컴페티션과 관련이 깊습니다. 앞서 소개한 것과 같이 컴페티션 제출에 필요한 모델 체크포인트를 저장하는 용도나 학습을 위해 전처리 데이터를 저장해 놓는 것 등입니다. 컴페티션이 진행 중일 때는 이러한 민감한 자료들이 유출되지 않도록 비공개 상태로 두어 관리하는 것이 좋습니다. 만약 컴페티션을 팀으로 참가하고 있다면 노트북에서 설명한 방법으로, Settings에서 자신이 허락하는 일부 사람에게만 접근 권한을 추가할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.