머신 러닝 교과서 with 파이썬, 사이킷런, 텐서플로(개정 3판): 3.3.5 규제를 사용하여 과대적합 피하기

slide 1 of 18, currently active
slide 2 of 18
slide 3 of 18
slide 4 of 18
slide 5 of 18
slide 6 of 18
slide 7 of 18
slide 8 of 18
slide 9 of 18
slide 10 of 18
slide 11 of 18
slide 12 of 18
slide 13 of 18
slide 14 of 18
slide 15 of 18
slide 16 of 18
slide 17 of 18
slide 18 of 18

좋은 편향-분산 트레이드오프를 찾는 한 가지 방법은 규제를 사용하여 모델의 복잡도를 조정하는 것입니다. 규제(regularization)는 공선성(collinearity)(특성 간의 높은 상관관계)을 다루거나 데이터에서 잡음을 제거하여 과대적합을 방지할 수 있는 매우 유용한 방법입니다.

규제는 과도한 파라미터(가중치) 값을 제한하기 위해 추가적인 정보(편향)를 주입하는 개념입니다. 가장 널리 사용하는 규제 형태는 다음과 같은 L2 규제입니다(이따금 L2 축소 또는 가중치 감쇠라고 부릅니다).¹⁴

이 식에서 λ는 규제 하이퍼파라미터입니다.

Note ≡ 규제와 특성 정규화(normalization)

규제는 표준화 같은 특성 스케일 조정이 중요한 또 다른 이유입니다. 규제가 잘 동작하려면 모든 특성이 비슷한 스케일을 가져야 합니다.

로지스틱 회귀의 비용 함수는 규제 항을 추가해서 규제를 적용합니다. 규제 항은 모델 훈련 과정에서 가중치를 줄이는 역할을 합니다.

규제 하이퍼파라미터 λ를 사용하여 가중치를 작게 유지하면서 훈련 데이터에 얼마나 잘 맞출지를 조정할 수 있습니다. λ 값을 증가하면 규제 강도가 높아집니다.

14 역주 L 2 규제에 사용하는 식은 L 2 노름의 제곱이지만 보통 L 2 규제라고 합니다. 4장에서 L1, L 2 규제에 대해 자세히 소개합니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.