더북(TheBook)

파이토치에서 제공하는 데이터셋 사용

토치비전(torchvision)은 파이토치에서 제공하는 데이터셋들이 모여 있는 패키지입니다. MNIST, ImageNet을 포함한 유명한 데이터셋들을 제공하고 있습니다. 다음 URL에서 파이토치에서 제공하는 데이터셋을 확인할 수 있습니다.

https://pytorch.org/vision/0.8/datasets.html

파이토치에서 제공하는 데이터셋을 내려받으려면 먼저 requests 라이브러리를 설치해야 합니다. requests는 HTTP 요청에 대한 처리를 위해 사용하며, 기본 내장 모듈이 아니기 때문에 필요하다면 별도로 설치해야 합니다.

> pip install requests

다음은 MNIST 데이터셋을 내려받는 예제입니다.

import torchvision.transforms as transforms

mnist_transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (1.0,))
]) ------ 평균이 0.5, 표준편차가 1.0이 되도록 데이터의 분포(normalize)를 조정

from torchvision.datasets import MNIST
import requests
download_root = '../chap02/data/MNIST_DATASET' ------ 내려받을 경로 지정

train_dataset = MNIST(download_root, transform=mnist_transform, train=True, download=True) ------ 훈련(training) 데이터셋
valid_dataset = MNIST(download_root, transform=mnist_transform, train=False, download=True) ------ 검증(validation) 데이터셋
test_dataset = MNIST(download_root, transform=mnist_transform, train=False, download=True) ------ 테스트(test) 데이터셋
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.