8번째 에포크에서 베스트 모델을 만들었고 23번째 에포크에서 학습이 중단되었습니다. 테스트 정확도는 99.17%로 향상되었습니다.
학습 과정을 그래프로 확인해 본 결과, 컨볼루션 신경망 모델로 만든 학습셋과 테스트셋의 오차가 이전의 얕은 구조로 만든 딥러닝 모델보다 작아졌음을 볼 수 있습니다.
99.17%의 정확도는 1만 개의 테스트 이미지 중 9,917개를 맞혔다는 의미입니다. 바로 앞의 ‘MNIST 손글씨 인식하기: 기본 프레임’ 실습에서는 정확도가 98.16%였으므로 101개의 이미지를 더 맞혔습니다. 100% 다 맞히지 못한 이유는 데이터 안에 다음과 같이 확인할 수 없는 글씨가 있었기 때문입니다.
그림 16-11 | 알아내지 못한 숫자의 예
우리가 만든 딥러닝 모델은 이미 사람의 인식 정도와 같거나 이를 뛰어넘는 인식률을 보여 준다고 해도 과언이 아니지요?