더북(TheBook)

▲ 그림 6-3 훈련 세트, 검증 세트, 테스트 세트 사용 방법

홀드아웃 방법은 훈련 데이터를 훈련 데이터셋과 검증 데이터셋으로 나누는 방법에 따라 성능 추정이 민감할 수 있다는 것이 단점입니다. 검증 데이터셋의 성능 추정이 어떤 샘플을 사용하느냐에 따라 달라질 것입니다. 다음 절에서 좀 더 안정적인 성능 추정 기법인 k -겹 교차 검증을 알아보겠습니다. 이 방법은 훈련 데이터를 k개의 부분으로 나누어 k번 홀드아웃 방법을 반복합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.