머신 러닝 교과서: 파이토치 편: 6.2.2 k-겹 교차 검증

>>> from sklearn.model_selection import cross_val_score
>>> scores = cross_val_score(estimator=pipe_lr,
...                          X=X_train,
...                          y=y_train,
...                          cv=10,
...                          n_jobs=1)
>>> print(f'CV 정확도 점수: {scores}')
CV 정확도 점수: [0.93478261  0.93478261  0.95652174
                0.95652174  0.93478261  0.95555556
                0.97777778  0.93333333  0.95555556
                0.95555556]
>>> print(f'CV 정확도: {np.mean(scores):.3f} '
...       f'+/- {np.std(scores):.3f}')
CV 정확도: 0.950 +/- 0.014

Note ≡

역주 cross_val_score 함수가 검증에 사용하는 기본 측정 지표는 회귀일 때는 R², 분류일 때는 정확도입니다. scoring 매개변수를 사용하여 다른 지표로 바꿀 수 있습니다. 사이킷런 0.19 버전에서는 교차 검증에 여러 측정 지표를 사용할 수 있는 cross_validate 함수가 추가되었습니다. 이 함수는 각 폴드에서 훈련과 테스트에 걸린 시간을 반환하고 scoring 매개변수에 지정한 평가 지표마다 훈련 점수와 테스트 점수를 반환합니다. 반환된 딕셔너리에서 훈련 점수와 테스트 점수를 추출하려면 ‘train_XXXX’, ‘test_XXXX’ 형식의 키를 사용하면 됩니다. 앞 코드는 다음과 같이 바꾸어 쓸 수 있습니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.