실행 결과
그림 14-2 | 학습셋에서 얻은 오차와 검증셋에서 얻은 오차 비교
그래프의 형태는 실행에 따라 조금씩 다를 수 있지만 대략 그림 14-2와 같은 그래프가 나옵니다. 우리가 눈여겨보아야 할 부분은 학습이 오래 진행될수록 검증셋의 오차(파란색)는 줄어들지만 테스트셋의 오차(빨간색)는 다시 커진다는 것입니다. 이는 과도한 학습으로 과적합이 발생했기 때문입니다. 이러한 사실을 통해 알 수 있는 것은 검증셋 오차가 커지기 직전까지 학습한 모델이 최적의 횟수로 학습한 모델이라는 것입니다.
이제 검증셋의 오차가 커지기 전에 학습을 자동으로 중단시키고, 그때의 모델을 저장하는 방법을 알아보겠습니다.