① 정규화 방법은 예제에서 구현한 StandardScaler() 외에도 세 가지가 더 있습니다.
ⓐ StandardScaler(): 각 특성의 평균을 0, 분산을 1로 변경하여 특성의 스케일을 조정합니다.
StandardScaler()를 구하는 공식은 다음과 같습니다.
다음은 StandardScaler()를 구현하는 예시 코드입니다.
from sklearn.preprocessing import StandardScaler
standardScaler = StandardScaler() ------ StandardScaler 객체 생성
print(standardScaler.fit(train_data)) ------ fit() 메서드를 사용하여 훈련 데이터셋을 적용
train_data_standardScaled = standardScaler.transform(train_data) ------ transform() 메서드를 사용하여 훈련 데이터셋을 적용
ⓑ RobustScaler(): 평균과 분산 대신 중간 값(median)과 사분위수 범위(InterQuartile Range, IQr)를 사용합니다. StandardScaler()와 비교하면 다음 그림과 같이 정규화 이후 동일한 값이 더 넓게 분포되어 있는 것을 확인할 수 있습니다.
▲ 그림 9-20 StandardScaler와 RobustScaler 비교