더북(TheBook)

반환된 훈련과 테스트 교차 검증 점수로부터 훈련 데이터셋 크기별로 평균 정확도를 계산하여 맷플롯립의 plot 함수를 사용해서 그래프를 그립니다. fill_between 함수를 사용하여 그래프에 평균 정확도의 표준 편차를 그려서 추정 분산을 나타냈습니다.

앞의 학습 곡선 그래프에서 볼 수 있듯이 모델 훈련에 250개의 샘플 이상을 사용할 때 훈련과 검증 데이터셋에서 잘 작동합니다. 훈련 데이터셋이 250개의 샘플보다 줄어들면 훈련 정확도가 증가하면서 훈련 정확도와 검증 정확도 사이의 차이는 넓어집니다. 이는 과대적합이 증가한다는 증거입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.