더북(TheBook)

마지막으로 독립적인 테스트 데이터셋을 사용하여 최고 모델의 성능을 추정합니다. 이 모델은 GridSearchCV 객체의 best_estimator_ 속성에서 얻을 수 있습니다.

>>> clf = gs.best_estimator_
>>> clf.fit(X_train, y_train)
>>> print(f'테스트 정확도: {clf.score(X_test, y_test):.3f}')
테스트 정확도: 0.974

그리드 서치를 수행한 후 clf.fit(X_train, y_train)을 실행하여 최상의 매개변수 조합과 훈련 데이터셋에서 모델(gs.best_estimator_)을 수동으로 다시 훈련할 필요가 없습니다. GridSearchCV 클래스의 refit 매개변수를 True로 지정하면(True가 이 매개변수의 기본값입니다) 전체 훈련 데이터셋에서 자동으로 gs.best_estimator_를 다시 훈련합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.