7.5 요약
이 장에서 가장 인기 있고 널리 사용되는 앙상블 학습의 기법을 살펴보았습니다. 앙상블 방법은 개별 분류기의 약점을 보완하기 위해 다양한 모델을 결합합니다. 머신 러닝 경연 대회는 물론 현업 애플리케이션을 위해서도 안정적이고 성능이 높은 모델을 만들 수 있어 매우 매력적입니다.
이 장 서두에서 다양한 분류 알고리즘을 결합할 수 있는 MajorityVoteClassifier 파이썬 클래스를 구현했습니다. 배깅은 훈련 데이터셋에서 랜덤한 부트스트랩 샘플을 추출하고 다수결 투표를 통해 훈련된 개별 분류기를 결합함으로써 모델의 분산을 감소시키는 기법입니다. 마지막으로 에이다부스트는 오차로부터 점진적으로 학습하는 약한 학습기를 기반으로 하는 알고리즘입니다.
여기까지 여러 장을 거치면서 다양한 학습 알고리즘과 튜닝, 평가 기법을 많이 배웠습니다. 다음 장에서는 인터넷과 소셜 미디어 세상에서 흥미로운 주제가 된 특별한 머신 러닝 애플리케이션인 감성 분석에 관해 살펴보겠습니다.