>>> from sklearn.model_selection import cross_val_score
>>> scores = cross_val_score(estimator=pipe_lr,
... X=X_train,
... y=y_train,
... cv=10,
... n_jobs=1)
>>> print(f'CV 정확도 점수: {scores}')
CV 정확도 점수: [0.93478261 0.93478261 0.95652174
0.95652174 0.93478261 0.95555556
0.97777778 0.93333333 0.95555556
0.95555556]
>>> print(f'CV 정확도: {np.mean(scores):.3f} '
... f'+/- {np.std(scores):.3f}')
CV 정확도: 0.950 +/- 0.014
Note ≡
역주 cross_val_score 함수가 검증에 사용하는 기본 측정 지표는 회귀일 때는 R2, 분류일 때는 정확도입니다. scoring 매개변수를 사용하여 다른 지표로 바꿀 수 있습니다. 사이킷런 0.19 버전에서는 교차 검증에 여러 측정 지표를 사용할 수 있는 cross_validate 함수가 추가되었습니다. 이 함수는 각 폴드에서 훈련과 테스트에 걸린 시간을 반환하고 scoring 매개변수에 지정한 평가 지표마다 훈련 점수와 테스트 점수를 반환합니다. 반환된 딕셔너리에서 훈련 점수와 테스트 점수를 추출하려면 ‘train_XXXX’, ‘test_XXXX’ 형식의 키를 사용하면 됩니다. 앞 코드는 다음과 같이 바꾸어 쓸 수 있습니다.