드롭아웃 예제는 텐서플로에서 제공하는 데이터셋인 imdb_reviews를 사용하겠습니다. 먼저 imdb_reviews 데이터셋을 사용하는 데 필요한 tensorflow_datasets 라이브러리를 설치합니다.
> pip install tensorflow_datasets
필요한 라이브러리를 호출합니다.
코드 8-14 라이브러리 호출
import tensorflow_datasets as tfds
import tensorflow as tf
tfds.load()를 사용하여 데이터셋을 내려받은 후 훈련과 검증 데이터셋으로 분리합니다.
코드 8-15 데이터셋 내려받기
(train_data, test_data), info = tfds.load(
'imdb_reviews/subwords8k',
split = (tfds.Split.TRAIN, tfds.Split.TEST),
with_info=True, as_supervised=True) ------ ①
padded_shapes = ([None], ())
train_batches = train_data.shuffle(1000).padded_batch(10, padded_shapes=padded_shapes) ------ ②
test_batches = test_data.shuffle(1000).padded_batch(10, padded_shapes=padded_shapes)