머신 러닝 교과서 with 파이썬, 사이킷런, 텐서플로(개정 3판): 6.2.2 k-겹 교차 검증

slide 1 of 17, currently active
slide 2 of 17
slide 3 of 17
slide 4 of 17
slide 5 of 17
slide 6 of 17
slide 7 of 17
slide 8 of 17
slide 9 of 17
slide 10 of 17
slide 11 of 17
slide 12 of 17
slide 13 of 17
slide 14 of 17
slide 15 of 17
slide 16 of 17
slide 17 of 17

cross_val_score 함수의 아주 유용한 기능은 각 폴드의 평가를 컴퓨터에 있는 복수 개의 CPU 코어에 분산할 수 있다는 점입니다. 앞서 StratifiedKFold 예에서처럼 n_jobs 매개변수를 1로 설정하면 하나의 CPU 코어만 성능 평가에 사용합니다. n_jobs = 2로 설정하면 두 개의 CPU 코어에 교차 검증을 10회씩 분산할 수 있습니다. n_jobs = -1로 설정하면 컴퓨터에 설치된 모든 CPU 코어를 사용하여 병렬 처리합니다.

Note ≡ 일반화 성능 추정

교차 검증에서 일반화 성능의 분산을 추정하는 자세한 방법은 책 범위를 넘어섭니다. 대신 이 주제를 자세히 다룬 모델 평가와 교차 검증에 관한 글을 참고하세요.⁶

또한, M. 마카토우(Markatou)가 쓴 훌륭한 논문에서 자세한 정보를 얻을 수 있습니다.⁷

.632+ 부트스트랩(.632+ Bootstrap) 교차 검증 방법 같은 다른 교차 검증 기법도 참고하세요.⁸

6 Model evaluation, model selection, and algorithm selection in machine learning. Raschka S. arXiv preprint arXiv:1811. 12808, 2018. https://arxiv.org/abs/1811.12808

역주 이 글은 역자의 블로그에 번역되어 있습니다(https://bit.ly/2pUx9AA).

7 Analysis of Variance of Cross-validation Estimators of the Generalization Error, M. Markatou, H. Tian, S. Biswas, and G. M. Hripcsak, Journal of Machine Learning Research, 6: 1127-1168, 2005

8 Improvements on Cross-validation: The .632+ Bootstrap Method, B. Efron and R. Tibshirani, Journal of the American Statistical Association, 92(438): 548-560, 1997

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.