더북(TheBook)

▲ 그림 6-4 k-겹 교차 검증

요약하면 k-겹 교차 검증에서 모든 데이터 포인트가 평가에 사용되기 때문에 검증 세트를 사용하는 홀드아웃 방법보다 k-겹 교차 검증이 데이터셋을 더 잘 활용합니다.

경험적으로 보았을 때 k-겹 교차 검증에서 좋은 기본값은 k = 10입니다. 예를 들어 론 코하비(Ron Kohavi)는 여러 종류의 실제 데이터셋에서 수행한 실험을 통해 10-겹 교차 검증이 가장 뛰어난 편향 -분산 트레이드오프를 가진다고 제안했습니다.3

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.