더북(TheBook)

특성 스케일링하기

대부분의 머신러닝 알고리즘을 사용할 때는 변수의 스케일을 0과 1로 조정하면 학습에 도움이 됩니다. 이를 특성 표준화(feature normalization)라고 합니다. 코드로는 다음과 같이 구현합니다.

[in :]

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

데이터의 스케일을 조정하고 나면, 이제 이를 이용해 여러 분류 모델을 훈련할 차례입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.