더북(TheBook)

실행 결과

Accuracy: 74.83 %
Standard Deviation: 5.41 %

앞서 결정 트리는 sklearn.tree에서 가져왔지만 랜덤 포레스트는 sklearn.ensemble 안에 있습니다. 앙상블(ensemble)이란 여러 머신 러닝 모델을 사용해 강력한 모델을 만드는 기법을 의미합니다. 여러 개의 결정 트리를 이용해 학습하는 랜덤 포레스트는 앙상블 기법의 대표적인 방법입니다.

classifier = RandomForestClassifier(n_estimators=50) 코드를 통해 사이킷런 랜덤 포레스트 알고리즘을 가져왔는데, 이때 n_estimators를 사용해 몇 개의 결정 트리를 사용할 것인지 정합니다.

앞서 결정 트리와 마찬가지로 열 개의 서브셋으로 나누어 학습과 테스트를 각각 실시했고 fit()predict() 함수가 각각 학습과 예측을, mean()std() 함수가 각각 평균과 표준편차를 구했습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.