더북(TheBook)

3 데이터 정규화 및 분류하기

인공지능 모델의 성능을 높이려면 데이터 정규화가 필요합니다. 여기에서는 데이터를 0과 1 사이의 값으로 바꾸어서 사용합니다.

scaler = MinMaxScaler(feature_range=(0, 1))
Dataset = scaler.fit_transform(dataset)
train_data, test_data = train_test_split(Dataset, test_size=0.2, shuffle=False)
print(len(train_data), len(test_data))

실행 결과

89 23

표 17-1 | 정규화 과정을 거친 데이터의 모습

scaler = MinMaxScaler(feature_range=(0, 1))

정규화하기 위한 방법을 scaler로 정하고, 이를 위해 사이킷런 라이브러리 중 MinMax Scaler 함수를 사용합니다. 또한, 데이터를 정규화하는 범위를 0~1 사이의 값(feature_range=(0, 1))으로 결정합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.