더북(TheBook)

Dataset = scaler.fit_transform(dataset)

바로 앞에서 만든 정규화 방법인 scaler를 사용한 후, MinMaxScaler 함수 중 fit_trans
form
함수를 사용하여 데이터를 정규화합니다. 그리고 이렇게 정규화한 데이터를 Dataset으로 정합니다.

train_data, test_data = train_test_split(Dataset, test_size=0.2, shuffle=False)

인공지능 모델을 만들 때에는 훈련 데이터와 검증 데이터를 사용합니다. 이렇게 구분하는 까닭은 바로 인공지능을 성능을 정확하게 측정하기 위함입니다. 만약 검증 데이터가 없이 훈련 데이터로만 인공지능의 성능을 측정하면 어떻게 될까요?

훈련한 데이터에는 너무나도 정확한 성능을 보이겠지만, 미처 훈련하지 않은 데이터를 가져가면 그 성능이 좋다고 단정할 수 없겠죠? 이를 위해 인공지능 모델을 개발할 때 훈련 데이터와 검증 데이터로 구분합니다.

그림 17-6 | 훈련 데이터와 검증 데이터로 구분

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.