더북(TheBook)

Note ≡


역주 RobustScaler는 중간 값(q2)을 빼고 1사분위수(q1)와 3사분위수(q3)의 차이로 나누어 데이터의 스케일을 조정합니다.

RobustScaler 사용법은 StandardScaler와 동일합니다.

>>> from sklearn.preprocessing import RobustScaler
>>> rbs = RobustScaler()
>>> X_train_robust = rbs.fit_transform(X_train)
>>> X_test_robust = rbs.transform(X_test)

결과를 비교하기 위해 넘파이를 사용하여 직접 ex 배열을 변환해 보겠습니다.

>>> (ex - np.percentile(ex, 50)) / (np.percentile(ex, 75) - np.percentile(ex, 25))
array([-1. , -0.6, -0.2,  0.2,  0.6,  1. ])

이외에도 MaxAbsScaler는 각 특성별로 데이터를 최대 절댓값으로 나눕니다. 따라서 각 특성의 최댓값은 1이 됩니다. 전체 특성은 [-1, 1] 범위로 변경됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.