앞에서 불러온 데이터셋을 훈련, 검증, 테스트 용도로 분리합니다.
코드 6-69 데이터셋을 훈련, 검증, 테스트 용도로 분리
random.seed(42)
random.shuffle(correct_images_filepaths)
train_images_filepaths = correct_images_filepaths[:400]
val_images_filepaths = correct_images_filepaths[400:-10]
test_images_filepaths = correct_images_filepaths[-10:]
print(len(train_images_filepaths), len(val_images_filepaths),
len(test_images_filepaths))
훈련, 검증, 테스트 데이터셋에 대한 이미지 수는 다음과 같습니다.
400 92 10
훈련 데이터셋은 400개, 검증 데이터셋은 92개, 테스트 데이터셋은 열 개로 구성되어 있습니다.
데이터를 가져와서 전처리를 적용합니다. 또한, 가져온 데이터가 개이면 레이블 ‘1’을 부여하고, 고양이라면 레이블 ‘0’을 부여합니다.