더북(TheBook)

1.3.2 클라우드 노트북

아무리 질 좋은 데이터가 있고, 그것을 분석할 수 있는 스킬이 있다 하더라도 정작 그 데이터를 불러와 다룰 수 있는 컴퓨팅 환경이 없으면 아무것도 할 수 없습니다. 하지만 데이터 분석을 위한 컴퓨터를 구입하거나 빌리는 것에는 적지 않은 비용이 들고, 컴퓨터를 구했다 하더라도 파이썬 또는 R언어를 실행할 수 있는 환경과 판다스 같은 데이터 분석에 필요한 라이브러리 등의 환경을 설정하는 작업도 선행되어야 합니다. 이런 작업에 익숙하지 않은 사람이라면 데이터 사이언스를 처음 시작하는 것이 매우 버겁게 느껴질 것입니다.

캐글에서는 이런 걱정을 할 필요 없이 캐글 플랫폼 내부에서 데이터를 분석하고 모델링할 수 있는 클라우드(Cloud) 환경을 제공합니다. 여기서 클라우드 환경이란 캐글이 관리하는 원격 서버로부터 일부 자원을 빌려 개인 컴퓨터에서 원격으로 사용할 수 있도록 구성한 환경을 말합니다. 프로그래밍 코드를 개인 컴퓨터에서 실행하는 것이 아니기 때문에 자신의 컴퓨터 사양이 좋지 않아도 충분히 사용할 수 있습니다. 또한, 데이터 사이언스에 자주 사용하는 라이브러리가 대부분 설치되어 있고 데이터 분석에 편리한 노트북 환경이 기본으로 설정되어 있어서 별다른 설정을 할 필요가 없습니다. 더 나아가 머신러닝, 딥러닝 모델 학습을 위해 연산 능력이 높은 장치가 필요할 수도 있는데, 캐글에서는 특수한 연산 능력을 가진 가속기(Accelerator)를 지원하기 때문에 계산량이 많은 모델 학습 시 추가하여 사용할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.