머신 러닝 교과서: 파이토치 편: 4.4 특성 스케일 맞추기

slide 1 of 18, currently active
slide 2 of 18
slide 3 of 18
slide 4 of 18
slide 5 of 18
slide 6 of 18
slide 7 of 18
slide 8 of 18
slide 9 of 18
slide 10 of 18
slide 11 of 18
slide 12 of 18
slide 13 of 18
slide 14 of 18
slide 15 of 18
slide 16 of 18
slide 17 of 18
slide 18 of 18

최소-최대 스케일 변환을 통한 정규화는 정해진 범위의 값이 필요할 때 유용하게 사용할 수 있는 일반적인 기법입니다. 표준화는 많은 머신 러닝 알고리즘, 특히 경사 하강법 같은 최적화 알고리즘에서 널리 사용됩니다. 3장에서 보았던 로지스틱 회귀와 SVM 같은 여러 선형 모델은 가중치를 0 또는 0에 가까운 작은 난수로 초기화합니다. 표준화를 사용하면 특성의 평균을 0에 맞추고 표준 편차를 1로 만들어 정규 분포와 같은 특징을 가지도록 만듭니다. 이는 가중치를 더 쉽게 학습할 수 있도록 만듭니다. 하지만 표준화가 분포 모양을 바꾸지 않으며 정규 분포가 아닌 데이터를 정규 분포로 바꾸는 것은 아닙니다. 또한, 평균이 0이고 단위 분산을 갖는 것 외에도 표준화는 이상치 정보가 유지되기 때문에 제한된 범위로 데이터를 조정하는 최소-최대 스케일 변환에 비해 알고리즘이 이상치에 덜 민감합니다.¹⁴

표준화 공식은 다음과 같습니다.

여기에서 μ_x는 어떤 특성의 샘플 평균이고 σ_x는 그에 해당하는 표준 편차입니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.