더북(TheBook)

5.3 뭔가 잘못되었다: 과대적합과 과소적합

지금까지 모델 훈련, 선택, 평가의 각 단계에 필요한 용어들을 알아보았습니다. 이 절에서는 학습할 때 발생할 수 있는 문제를 조금 더 살펴보겠습니다. 시험 시나리오로 다시 돌아가 봅시다. 여러분이 시험을 보았는데 성적이 기대만큼 잘 나오지 않은 것 같습니다. “다음에는 실수하지 마.”라는 말 대신 실수의 구체적인 원인을 알면 더 좋겠지요. 시험 성적이 잘 나오지 않은 첫 번째 원인은 (1) 좋은 점수를 받기 위해 필요한 만큼 노력을 기울이지 않았거나 (2) 필요 없는 디테일에 집중력을 낭비했기 때문입니다. 두 번째 원인은 친구나 넷플릭스 같은 주변의 잡음으로 주의력이 흐트러진 것입니다. 학습 시스템에서는 이러한 두 가지 문제를 과소적합(overfitting)과 과대적합(underfitting)이라고 합니다. 간단한 예제 데이터셋으로 과소적합과 과대적합을 알아보겠습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.