cross_val_score 함수의 아주 유용한 기능은 각 폴드의 평가를 컴퓨터에 있는 복수 개의 CPU 코어에 분산할 수 있다는 점입니다. 앞서 StratifiedKFold 예에서처럼 n_jobs 매개변수를 1로 설정하면 하나의 CPU 코어만 성능 평가에 사용합니다. n_jobs = 2로 설정하면 두 개의 CPU 코어에 교차 검증을 10회씩 분산할 수 있습니다. n_jobs = -1로 설정하면 컴퓨터에 설치된 모든 CPU 코어를 사용하여 병렬 처리합니다.
Note ≡ 일반화 성능 추정
교차 검증에서 일반화 성능의 분산을 추정하는 자세한 방법은 책 범위를 넘어섭니다. 대신 이 주제를 자세히 다룬 모델 평가와 교차 검증에 관한 글을 참고하세요.6
또한, M. 마카토우(Markatou)가 쓴 훌륭한 논문에서 자세한 정보를 얻을 수 있습니다.7
.632+ 부트스트랩(.632+ Bootstrap) 교차 검증 방법 같은 다른 교차 검증 기법도 참고하세요.8
6 Model evaluation, model selection, and algorithm selection in machine learning. Raschka S. arXiv preprint arXiv:1811. 12808, 2018. https://arxiv.org/abs/1811.12808
역주 이 글은 역자의 블로그에 번역되어 있습니다(https://bit.ly/2pUx9AA).
7 Analysis of Variance of Cross-validation Estimators of the Generalization Error, M. Markatou, H. Tian, S. Biswas, and G. M. Hripcsak, Journal of Machine Learning Research, 6: 1127-1168, 2005
8 Improvements on Cross-validation: The .632+ Bootstrap Method, B. Efron and R. Tibshirani, Journal of the American Statistical Association, 92(438): 548-560, 1997