더북(TheBook)

실행 결과를 보면 화면의 왼쪽 상단부터 첫 번째 이미지에 대한 예측 값과 실제 값이 표시된 모습을 볼 수 있습니다. 첫 번째 이미지를 예측한 값(Predicted)은 6이지만 실제 값(Class)이 5입니다. 두 번째 이미지 또한 예측한 값(Predicted)은 9이지만, 실제 값(Class)이 2입니다.


과적합 문제가 생길 수 있어요!

인공지능 모델의 학습 횟수를 무작정 늘린다고 해서 인공지능의 성능이 계속 높아지는 것은 아닙니다. 바로 과적합(overfitting)의 문제가 일어날 수 있기 때문입니다.

과적합이란 인공지능이 훈련 데이터에만 최적화되는 것을 의미합니다. 인공지능 모델을 계속 학습시킨다면 인공지능 모델이 학습하고 있는 데이터, 즉 훈련 데이터만 잘 구별할 수 있습니다. 이 경우 새로운 데이터인 검증 데이터를 인공지능 모델에 넣었을 때 잘 구별하지 못하는, 즉 성능이 나빠지는 현상을 볼 수 있습니다.

이러한 현상을 바로 ‘과적합’이라고 합니다. 그렇기 때문에 인공지능 모델을 학습시킬 때 얼마만큼 학습시키는 것이 좋은지 결정하는 것 또한 인공지능 모델 설계에서 중요한 부분입니다.

지금까지 첫 번째 인공지능, 숫자를 구분하는 인공지능을 만들어 보았습니다. 갑자기 어려운 코드들이 나와서 많이 당황스러웠나요? 코드 하나하나를 세부 의미까지 이해하는 것도 중요하지만 딥러닝의 개발 흐름을 알아보는 것이 이 책의 목표이기 때문에 전반적인 흐름에 대한 이해를 먼저 하는 것을 추천합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.