특성 스케일링하기
대부분의 머신러닝 알고리즘을 사용할 때는 변수의 스케일을 0과 1로 조정하면 학습에 도움이 됩니다. 이를 특성 표준화(feature normalization)라고 합니다. 코드로는 다음과 같이 구현합니다.
[in :]
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)
데이터의 스케일을 조정하고 나면, 이제 이를 이용해 여러 분류 모델을 훈련할 차례입니다.