더북(TheBook)

앙상블에 있는 각 분류기의 매개변수에 접근하기 위해 _name_estimators 함수9를 사용했고 따로 get_params 메서드를 정의했습니다. 처음에는 조금 복잡해 보일지 모르지만 다음 절에서 그리드 서치를 사용하여 하이퍼파라미터를 튜닝할 때 완전히 이해될 것입니다.

Note ≡ 사이킷런의 VotingClassifier


MajorityVoteClassifier 클래스는 학습 목적으로 구현한 것입니다. 책 1판에서 구현한 것을 기반으로 사이킷런에 좀 더 수준 높은 다수결 투표 분류기를 추가했습니다. 이 앙상블 분류기는 sklearn.ensemble.VotingClassifier로 사이킷런 0.17 버전 또는 그 이후 버전에서 사용할 수 있습니다.10

 

 


  9 역주 pipeline 모듈에 있는 _name_estimators 함수는 추정기 객체의 리스트를 입력받아 소문자 클래스 이름과 객체로 이루어진 튜플의 리스트를 반환합니다. 클래스의 객체가 두 개 이상 있으면 소문자 클래스 이름 뒤에 ‘-’와 1부터 증가되는 숫자를 덧붙입니다.

10 역주 여기서 구현한 MajorityVoteClassifiervote 매개변수는 VotingClassifiervoting 매개변수에 해당됩니다. voting 매개변수의 기본값은 다수결 투표를 기반으로 예측하는 'hard'이고, 확률을 기반으로 하는 'soft'도 있습니다. VotingClassifier 클래스의 사용법은 7.2.2절 끝에 있는 역주 노트를 참고하세요.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.