더북(TheBook)

A.1 코랩

A.1.1 코랩이란

책에서는 주피터 노트북을 이용하여 실습을 진행했습니다. 책의 예제는 CPU나 GPU에서 모두 실행 가능합니다. 더불어 요즘 많이 사용하는 코랩에서 예제 파일을 실행하는 방법을 간단히 알아보겠습니다.

코랩(Colab)의 정식 명칭은 Colaboratory이지만 줄여서 Colab이라고 부릅니다. 코랩을 사용하면 웹 브라우저에서 파이썬을 작성하고 실행할 수 있습니다.

▲ 그림 A-1 구글 코랩

코랩을 사용하는 이유는 다음과 같습니다.

무료입니다.

머신 러닝/딥러닝을 사용할 수 있는 별도의 환경 설정이 필요하지 않습니다.

클라우드 환경으로 여러 명이 동시에 수정할 수 있습니다.

GPU를 손쉽게 사용할 수 있습니다.

하지만 단점도 있으므로 주의하여 사용해야 합니다.

세션 시간에 제약이 있습니다.

세션 시간이 만료되면 작업하던 데이터가 유실됩니다.

참고로 클라우드에 올려서 사용할 수 없는 데이터( 개인 정보가 포함된 데이터)가 있기 때문에 사용하기 전에 확인이 필요합니다.

 

 

 

A.1.2 코랩에서 예제 파일 실행

책의 예제 파일을 코랩에 업로드하여 실행해 보겠습니다.

1. 구글 웹 사이트에 접속한 후 계정을 생성합니다. 이미 계정이 있다면 이 과정은 생략합니다.

▲ 그림 A-2 구글 계정 생성

2. 코랩 웹 사이트에 접속한 후 새 노트를 클릭합니다.

https://colab.research.google.com/

 

▲ 그림 A-3 새 노트 시작

3. 다음 코드를 입력하여 텐서플로 버전을 확인합니다. 실행 버튼을 클릭하거나 Shift+Enter를 눌러 실행합니다. 결과가 나오면 책의 버전과 맞는지 확인해 주세요.

▲ 그림 A-4 텐서플로 버전 확인

4. 파일 > 노트 업로드를 선택합니다.

▲ 그림 A-5 [노트 업로드] 메뉴 선택

5. 다음 창이 뜨면 파일 선택을 클릭하여 업로드할 파일을 선택하면 됩니다. 3장 예제 파일을 선택하겠습니다.

▲ 그림 A-6 업로드할 예제 파일 선택

6. 다음과 같이 3장 예제 파일을 불러왔습니다.

▲ 그림 A-7 업로드한 예제 파일 확인

7. 지금은 파이썬 파일만 불러온 것입니다. 필요한 데이터셋들을 업로드해야 합니다. 데이터를 불러오는 코드가 나오면 다음과 같이 수정합니다. 자세한 설명은 ‘코랩에 데이터를 업로드하는 두 가지 방법’ 노트를 참고하세요.

dataset = pd.read_csv('../chap3/data/iris.data', names=names)

from google.colab import files # 데이터 불러오기
file_uploaded = files.upload() # 데이터 불러오기
dataset = pd.read_csv('iris.data', names=names) # 경로를 수정해야 합니다.

8. 코드를 실행하면 다음과 같이 파일 선택이 나타나는데, 이것을 클릭합니다.

▲ 그림 A-8 업로드할 데이터 파일 선택

9. 사용할 iris.data 파일을 선택하면 다음과 같이 코랩에 데이터가 업로드됩니다.

▲ 그림 A-9 데이터 파일이 업로드된 상태

코랩에서는 GPU도 무료로 제공합니다. GPU를 사용하고 싶다면 런타임 > 런타임 유형 변경을 선택한 후 하드웨어 가속기 옵션에서 GPU를 설정하면 됩니다.

▲ 그림 A-10 GPU 설정

다음 코드를 실행하면 GPU를 사용하고 있는 것을 알 수 있습니다.

import tensorflow as tf
tf.config.list_physical_devices('GPU')

▲ 그림 A-11 GPU 구동 여부 확인

Note ≡ 코랩에 데이터를 업로드하는 두 가지 방법


코랩에 데이터를 업로드하는 방법은 다음과 같이 두 가지입니다.

▲ 그림 A-12 코랩에서 데이터를 호출하는 방법

사용자 PC에서 파일 업로드하기

1. 다음 코드를 입력합니다. 데이터를 불러오는 코드입니다.

from google.colab import files
file_uploaded = files.upload()

 

2. 파일 선택이 나타나면 필요한 파일을 클릭하여 업로드합니다.

▲ 그림 A-13 사용자 PC에서 파일 업로드

3. 데이터가 업로드되면 경로가 바뀌므로 꼭 다음과 같이 코드의 데이터 경로를 수정해야 합니다.

dataset = pd.read_csv('../chap3/data/iris.data', names=names)

dataset = pd.read_csv('iris.data', names=names)

 

구글 드라이브에서 파일 업로드하기

1. 구글 드라이브에 폴더를 만들고 필요한 데이터를 업로드합니다.

2. 다음 코드를 입력하여 실행합니다. 구글 드라이브와 연결하는 코드입니다.

from google.colab import drive
drive.mount('/content/drive/')

 

3. 다음과 같이 ‘Enter your authorization code’를 입력하라는 문구가 나옵니다. ‘Go to this URL in a browser’ 옆의 URL을 클릭합니다.

▲ 그림 A-14 구글 드라이브와 연결

4. 계정 선택 화면이 나오면 ‘자신의 계정을 선택’하고 액세스 허용 메시지가 표시되면 허용을 누릅니다.

5. 다음과 같이 코드가 생성되면 복사합니다.

▲ 그림 A-15 생성된 코드 복사

6. 생성된 코드를 그림 A-14의 빈칸에 입력하면 다음과 같이 구글 드라이브와 연결됩니다.

▲ 그림 A-16 복사된 코드 붙여넣기

7. 그러고 나서 왼쪽 폴더 아이콘을 클릭하여 원하는 데이터 파일을 선택한 후 마우스 오른쪽 버튼을 눌러 경로 복사를 선택합니다.

▲ 그림 A-17 데이터 파일 선택 및 경로 복사

8. 복사한 경로로 코드의 데이터셋 위치를 수정한 후 실행합니다.

▲ 그림 A-18 코드에서 데이터셋 경로 수정 후 실행

Note ≡ 코랩에서 필요한 라이브러리를 설치하려면?


코랩에서 필요한 라이브러리는 다음과 같이 설치할 수 있습니다.

!pip install pandas
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.