프로그래머가 알아야 할 알고리즘 40: 7.2.5 앙상블 알고리즘

slide 1 of 18, currently active
slide 2 of 18
slide 3 of 18
slide 4 of 18
slide 5 of 18
slide 6 of 18
slide 7 of 18
slide 8 of 18
slide 9 of 18
slide 10 of 18
slide 11 of 18
slide 12 of 18
slide 13 of 18
slide 14 of 18
slide 15 of 18
slide 16 of 18
slide 17 of 18
slide 18 of 18

랜덤 포레스트 알고리즘 사용하기

랜덤 포레스트 알고리즘은 여러 결정 트리를 묶어 편향과 분산을 낮추는 앙상블 기법입니다.

랜덤 포레스트 모델 훈련하기

이 알고리즘은 전체 훈련 데이터 중 샘플 N개로 구성된 하위 훈련 데이터를 m개 생성합니다. 이 하위 훈련 데이터는 입력 데이터의 행과 열을 무작위로 샘플링하여 만듭니다. 이를 이용해 랜덤 포레스트 알고리즘은 독립된 결정 트리 m개를 훈련합니다. 이 분류 트리들을 C₁, C₂, …, C_m으로 지칭하겠습니다.

랜덤 포레스트 모델로 예측하기

훈련된 트리들은 각자 라벨을 예측합니다. 랜덤 포레스트 알고리즘은 개별 예측 결과를 모아서 최종 예측 결과를 출력합니다.

▲ 그림 7-5 랜덤 포레스트 알고리즘

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.