더북(TheBook)

모형을 적용하기 위한 데이터셋을 준비합니다.

코드 7-5 데이터셋 준비

(x_train, y_train), (x_test, y_test) = tf.keras.datasets.imdb.load_data(num_
                                       words=total_words) ------ ①

x_train = tf.keras.preprocessing.sequence.pad_sequences(x_train, maxlen=max_review_len) ------②
x_test = tf.keras.preprocessing.sequence.pad_sequences(x_test, maxlen=max_review_len)

train_data = tf.data.Dataset.from_tensor_slices((x_train, y_train)) ------ ③
train_data = train_data.shuffle(10000).batch(batch_size, drop_remainder=True) ------ ④
test_data = tf.data.Dataset.from_tensor_slices((x_test, y_test)) ------ x_test, y_test 데이터에 대한 넘파일 배열(numpy array)을 바로 Dataset으로 변환
test_data = test_data.batch(batch_size, drop_remainder=True) ------ 테스트 데이터셋을 변환
print('x_train_shape:', x_train.shape, tf.reduce_max(y_train), tf.reduce_min(y_train))
print('x_test_shape:', x_test.shape)

sample = next(iter(test_data))
print(sample[0].shape)
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.