더북(TheBook)

① 정규화 방법은 예제에서 구현한 StandardScaler() 외에도 세 가지가 더 있습니다.

StandardScaler(): 각 특성의 평균을 0, 분산을 1로 변경하여 특성의 스케일을 조정합니다.

StandardScaler()를 구하는 공식은 다음과 같습니다.

다음은 StandardScaler()를 구현하는 예시 코드입니다.

from sklearn.preprocessing import StandardScaler
standardScaler = StandardScaler()  ------ StandardScaler 객체 생성
print(standardScaler.fit(train_data))  ------ fit() 메서드를 사용하여 훈련 데이터셋을 적용
train_data_standardScaled = standardScaler.transform(train_data) ------ transform() 메서드를 사용하여 훈련 데이터셋을 적용

RobustScaler(): 평균과 분산 대신 중간 값(median)과 사분위수 범위(InterQuartile Range, IQr)를 사용합니다. StandardScaler()와 비교하면 다음 그림과 같이 정규화 이후 동일한 값이 더 넓게 분포되어 있는 것을 확인할 수 있습니다.

▲ 그림 9-20 StandardScaler와 RobustScaler 비교

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.