모형을 적용하기 위한 데이터셋을 준비합니다.
코드 7-5 데이터셋 준비
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.imdb.load_data(num_
words=total_words) ------ ①
x_train = tf.keras.preprocessing.sequence.pad_sequences(x_train, maxlen=max_review_len) ------②
x_test = tf.keras.preprocessing.sequence.pad_sequences(x_test, maxlen=max_review_len)
train_data = tf.data.Dataset.from_tensor_slices((x_train, y_train)) ------ ③
train_data = train_data.shuffle(10000).batch(batch_size, drop_remainder=True) ------ ④
test_data = tf.data.Dataset.from_tensor_slices((x_test, y_test)) ------ x_test, y_test 데이터에 대한 넘파일 배열(numpy array)을 바로 Dataset으로 변환
test_data = test_data.batch(batch_size, drop_remainder=True) ------ 테스트 데이터셋을 변환
print('x_train_shape:', x_train.shape, tf.reduce_max(y_train), tf.reduce_min(y_train))
print('x_test_shape:', x_test.shape)
sample = next(iter(test_data))
print(sample[0].shape)