3 데이터 정규화 및 분류하기
인공지능 모델의 성능을 높이려면 데이터 정규화가 필요합니다. 여기에서는 데이터를 0과 1 사이의 값으로 바꾸어서 사용합니다.
scaler = MinMaxScaler(feature_range=(0, 1)) Dataset = scaler.fit_transform(dataset) train_data, test_data = train_test_split(Dataset, test_size=0.2, shuffle=False) print(len(train_data), len(test_data))
실행 결과
89 23
표 17-1 | 정규화 과정을 거친 데이터의 모습
■ scaler = MinMaxScaler(feature_range=(0, 1))
정규화하기 위한 방법을 scaler로 정하고, 이를 위해 사이킷런 라이브러리 중 MinMax Scaler 함수를 사용합니다. 또한, 데이터를 정규화하는 범위를 0~1 사이의 값(feature_range=(0, 1))으로 결정합니다.