더북(TheBook)

앞에서 불러온 데이터셋을 훈련, 검증, 테스트 용도로 분리합니다.

코드 6-69 데이터셋을 훈련, 검증, 테스트 용도로 분리

random.seed(42)
random.shuffle(correct_images_filepaths)
train_images_filepaths = correct_images_filepaths[:400]
val_images_filepaths = correct_images_filepaths[400:-10]
test_images_filepaths = correct_images_filepaths[-10:]
print(len(train_images_filepaths), len(val_images_filepaths),
    len(test_images_filepaths))

훈련, 검증, 테스트 데이터셋에 대한 이미지 수는 다음과 같습니다.

400 92 10

훈련 데이터셋은 400개, 검증 데이터셋은 92개, 테스트 데이터셋은 열 개로 구성되어 있습니다.

데이터를 가져와서 전처리를 적용합니다. 또한, 가져온 데이터가 개이면 레이블 ‘1’을 부여하고, 고양이라면 레이블 ‘0’을 부여합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.