더북(TheBook)

1.3 코드

코드(Code)란 캐글 플랫폼에서 만들어지는 모든 분석 자료와 솔루션, 그리고 그것을 작성하고 실행할 수 있는 클라우드 컴퓨팅 환경을 통틀어 가리킵니다. 캐글은 과거부터 여러 컴페티션을 개최해오면서 다양한 데이터셋을 구축했고, 컴페티션에 참가한 캐글러들은 자신들의 데이터 사이언스 스킬을 활용해 다양한 분석 자료와 솔루션을 만들었습니다. 이 자료들은 일종의 ‘프로그래밍 코드’형태로 저장되어 다른 이에게 공유됩니다. 공유된 자료들은 누구나 캐글 클라우드 환경에서 실행해볼 수 있고, 직접 수정 보완하는 것도 가능하기 때문에 데이터 사이언스를 공부하는 많은 캐글러에게 좋은 스터디 자료로 활용되었습니다. 캐글러들은 여기에 더해서 자신이 공부하여 얻은 것을 바탕으로 다른 컴페티션과 새로운 데이터에도 적용하기 시작했습니다. 그 결과, 분석 자료 및 솔루션이 지속해서 만들어질 수 있는 생태계가 생기면서 캐글이 지금처럼 거대한 데이터 사이언스 플랫폼으로 거듭나게 되었습니다.

이 절에서는 보물 같은 자료들이 모여 있는 캐글의 코드에 대해 자세히 알아보겠습니다. 캐글에서 프로그래밍 코드를 작성하고 실행할 때 주로 사용되는 노트북에 대한 내용, 캐글 코드에서 사용할 수 있는 클라우드 컴퓨팅 환경에 대한 소개, 노트북 버전을 만드는 방법, 마지막으로 코드 자료가 다른 캐글러에게 공유되기까지의 과정에 대해서 알아보겠습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.