더북(TheBook)

드롭아웃 예제는 텐서플로에서 제공하는 데이터셋인 imdb_reviews를 사용하겠습니다. 먼저 imdb_reviews 데이터셋을 사용하는 데 필요한 tensorflow_datasets 라이브러리를 설치합니다.

> pip install tensorflow_datasets

필요한 라이브러리를 호출합니다.

코드 8-14 라이브러리 호출

import tensorflow_datasets as tfds
import tensorflow as tf

tfds.load()를 사용하여 데이터셋을 내려받은 후 훈련과 검증 데이터셋으로 분리합니다.

코드 8-15 데이터셋 내려받기

(train_data, test_data), info = tfds.load(
    'imdb_reviews/subwords8k',
    split = (tfds.Split.TRAIN, tfds.Split.TEST),
    with_info=True, as_supervised=True) ------ ①

padded_shapes = ([None], ())
train_batches = train_data.shuffle(1000).padded_batch(10, padded_shapes=padded_shapes) ------ ②
test_batches = test_data.shuffle(1000).padded_batch(10, padded_shapes=padded_shapes)
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.