더북(TheBook)

5.9.3 연습 문제

이 장에서는 여러 평가 기법을 소개했습니다. 평가 기법들을 아직 직접적으로 비교하지는 않았지요. LOOCV와 2-폴드, 3-폴드, 5-폴드, 10-폴드 CV를 직접 비교할 수 있을까요? 폴드 개수가 늘어나면 어떤 점이 달라질까요? 모델 추정 값의 분산은 평균이나 중앙값을 구하는 것으로 간단히 구현해 볼 수 있습니다. 20개의 무작위 값으로 된 작은 데이터셋을 만들어 보세요. 이 중 열 개의 값을 무작위로 고른 후 평균과 중앙값을 계산하세요. 이 과정을 다섯 번 반복해 보세요. 평균값들은 서로 다른가요? 중앙값들은 어떤가요? 또 전체 20개의 평균과 중앙값에 비해서는 어떤가요?

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.