학습을 진행해도 테스트 결과가 더 이상 좋아지지 않는 지점에서 학습을 멈추어야 합니다. 이때 학습 정도가 가장 적절한 것으로 볼 수 있습니다.
우리가 다루는 초음파 광물 예측 데이터를 만든 세즈노프스키 교수가 실험 결과를 발표한 논문의 일부를 가져와 보겠습니다.
그림 13-5 | 학습셋과 테스트셋 정확도 측정의 예(RP Gorman et.al., 1998)
여기서 눈여겨보아야 할 부분은 은닉층(Number of Hidden Units) 개수가 올라감에 따라 학습셋의 예측률(Average Performance on Training Sets)과 테스트셋의 예측률(Average Performance on Testing Sets)이 어떻게 변하는지입니다. 이 부분만 따로 뽑아 정리하면 표 13-1과 같습니다.
표 13-1 | 은닉층 개수의 변화에 따른 학습셋 및 테스트셋의 예측률
은닉층 개수의 변화 |
학습셋의 예측률 |
테스트셋의 예측률 |
0 |
79.3 |
73.1 |
2 |
96.2 |
85.7 |
3 |
98.1 |
87.6 |
6 |
99.4 |
89.3 |
12 |
99.8 |
90.4 |
24 |
100 |
89.2 |