더북(TheBook)

이 그림에서 보다시피 결정 트리 m개를 훈련했습니다. 결정 트리 모델들은 {C1, ..., Cm}입니다. 각 트리가 생성한 예측 결과도 다음과 같이 세트로 표기할 수 있습니다.

개별 예측 결과 = P = {P1, ..., Pm}

최종 예측 결과는 Pf로 표기합니다. 이는 가장 많이 득표한 개별 예측 결과입니다. mode 함수를 이용하면 발생 빈도가 가장 많은 예측 결과를 추출할 수 있습니다(mode는 가장 많이 반복된 수를 의미합니다). 개별 예측 결과와 최종 예측 결과는 다음과 같이 연결되어 있습니다.

Pf = mode(P)

 

랜덤 포레스트 모델과 다른 앙상블 부스팅 기법의 차이점

랜덤 포레스트 알고리즘으로 생성된 개별 트리들은 서로 독립적입니다. 각 트리들은 다른 트리들의 세부 사항을 알지 못합니다. 이는 앙상블 부스팅 기법과 구별되는 랜덤 포레스트 알고리즘의 특징입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.