모형을 적용하기 위한 데이터셋을 준비합니다.

    코드 7-5 데이터셋 준비

    (x_train, y_train), (x_test, y_test) = tf.keras.datasets.imdb.load_data(num_
                                           words=total_words) ------ ①
    
    x_train = tf.keras.preprocessing.sequence.pad_sequences(x_train, maxlen=max_review_len) ------②
    x_test = tf.keras.preprocessing.sequence.pad_sequences(x_test, maxlen=max_review_len)
    
    train_data = tf.data.Dataset.from_tensor_slices((x_train, y_train)) ------ ③
    train_data = train_data.shuffle(10000).batch(batch_size, drop_remainder=True) ------ ④
    test_data = tf.data.Dataset.from_tensor_slices((x_test, y_test)) ------ x_test, y_test 데이터에 대한 넘파일 배열(numpy array)을 바로 Dataset으로 변환
    test_data = test_data.batch(batch_size, drop_remainder=True) ------ 테스트 데이터셋을 변환
    print('x_train_shape:', x_train.shape, tf.reduce_max(y_train), tf.reduce_min(y_train))
    print('x_test_shape:', x_test.shape)
    
    sample = next(iter(test_data))
    print(sample[0].shape)
    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.