더북(TheBook)

7.3 배깅: 부트스트랩 샘플링을 통한 분류 앙상블

배깅은 이전 절에서 구현한 MajorityVoteClassifier와 매우 밀접한 앙상블 학습 기법입니다. 앙상블에 있는 개별 분류기를 동일한 훈련 데이터셋으로 학습하는 것이 아니라 원본 훈련 데이터셋에서 부트스트랩(bootstrap) 샘플(중복을 허용한 랜덤 샘플)을 뽑아서 사용합니다. 배깅을 bootstrap aggregating이라고도 합니다.

그림 7- 6에 배깅 개념을 요약했습니다.

▲ 그림 7-6 배깅

다음 절에서 사이킷런을 사용하여 와인 샘플을 분류하는 간단한 배깅 예제를 살펴보겠습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.