더북(TheBook)

(1) 로컬 데이터 업로드

로컬 데이터를 데이터셋으로 만듭니다. 업로드하고 싶은 파일을 선택하거나 드래그해서 끌어다 놓으면 파일이 업로드 대기열에 등록됩니다. 업로드 게이지가 모두 찬 후 데이터셋 제목을 입력하고 Create를 누르면 데이터셋을 생성할 수 있습니다. 업로드한 데이터 용량에 따라 만들어지기까지 시간이 조금 소요되는데, 백그라운드 컴퓨터에서 실행되므로 브라우저를 종료하더라도 계속 진행됩니다. 시간이 지난 뒤 다 만들어진 데이터셋은 내 프로필의 데이터셋에서 확인할 수 있습니다. 간단하게는 ‘Datasets’ 페이지에서 Your Work를 누르면 바로 내 프로필의 데이터셋으로 이동할 수 있습니다.

(2) Notebook Output

캐글 노트북을 버전으로 저장한 뒤에 만들어지는 Output을 데이터셋으로 생성할 수 있습니다. 자신이 만든 노트북은 물론 다른 캐글러가 만든 공개된 노트북도 가능합니다. 원하는 노트북을 선택하면 그 노트북의 Output으로 만들어진 데이터가 모두 선택되고 데이터셋으로 만들 수 있습니다. 한 가지 불편한 점은, Notebook Output은 경우에 따라 여러 파일이 만들어질 수 있는데 이 가운데 필요한 파일만 선택해서 데이터셋을 만들 수는 없다는 점입니다.

Notebook Output 방법은 조금 뒤 1.4.3절 데이터셋 활용에서 소개할 Code Competition에서 거의 필수라 할 수 있을 정도로 매우 중요하므로 반드시 기억하고 있어야 합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.