최소-최대 스케일 변환을 통한 정규화는 정해진 범위의 값이 필요할 때 유용하게 사용할 수 있는 일반적인 기법입니다. 표준화는 많은 머신 러닝 알고리즘, 특히 경사 하강법 같은 최적화 알고리즘에서 널리 사용됩니다. 3장에서 보았던 로지스틱 회귀와 SVM 같은 여러 선형 모델은 가중치를 0 또는 0에 가까운 작은 난수로 초기화합니다. 표준화를 사용하면 특성의 평균을 0에 맞추고 표준 편차를 1로 만들어 정규 분포와 같은 특징을 가지도록 만듭니다. 이는 가중치를 더 쉽게 학습할 수 있도록 만듭니다. 하지만 표준화가 분포 모양을 바꾸지 않으며 정규 분포가 아닌 데이터를 정규 분포로 바꾸는 것은 아닙니다. 또한, 평균이 0이고 단위 분산을 갖는 것 외에도 표준화는 이상치 정보가 유지되기 때문에 제한된 범위로 데이터를 조정하는 최소-최대 스케일 변환에 비해 알고리즘이 이상치에 덜 민감합니다.14
표준화 공식은 다음과 같습니다.
여기에서 μx는 어떤 특성의 샘플 평균이고 σx는 그에 해당하는 표준 편차입니다.