더북(TheBook)

Note ≡


역주 GridSearchCV 클래스와 cross_validate 함수에서 return_train_score 매개변수를 True로 지정하면 훈련 폴드에 대한 점수를 계산하여 반환합니다. 훈련 데이터셋에 대한 점수를 보고 과대적합과 과소적합에 대한 정보를 얻을 수 있지만 실행 시간이 오래 걸릴 수 있습니다. param_range에 여덟 개의 값이 지정되어 있기 때문에 SVC 모델은 'linear' 커널에 대해 여덟 번, 'rbf' 커널에 대해 64번의 교차 검증이 수행됩니다. 따라서 훈련 폴드마다 반환되는 점수는 총 72개입니다. 이 값은 GridSearchCV 클래스의 cv_results_ 딕셔너리 속성에 split{폴드번호}_train_score와 같은 키에 저장되어 있습니다. 예를 들어 첫 번째 폴드의 점수는 'split0_train_score' 키로 저장되어 있습니다.

>>> gs = GridSearchCV(estimator=pipe_svc, 
...                   param_grid=param_grid, 
...                   scoring='accuracy', 
...                   cv=10,
...                   return_train_score=True,
...                   n_jobs=-1)
>>> gs = gs.fit(X_train, y_train)
>>> gs.cv_results_['split0_train_score']
array([0.6405868 , 0.93643032, 0.97555012, 0.98777506, 0.98533007, 
       0.99266504, 0.99755501, 1.        , 0.62591687, 0.62591687, 
       0.62591687, 0.62591687, 0.62591687, 0.62591687, 0.62591687, 
       0.62591687, 0.62591687, 0.62591687, 0.62591687, 0.62591687, 
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.