더북(TheBook)

4 랜덤 포레스트

 

랜덤 포레스트(random forest)는 앞서 배운 결정 트리를 여러 개 묶어 놓은 것입니다. 트리(tree)를 묶어 놓았으니 포레스트(forest)라는 이름이 붙었지요. 하나의 결정 트리가 아닌, 많은 수의 결정 트리를 실행해 그로부터 나온 분류 결과를 취합해서 최종 예측을 하는 알고리즘입니다. 너무 단순한 원리로 인해 과적합에 빠지기 쉬운, 결정 트리의 단점을 보완해 줍니다.

 

역시 사이킷런을 활용해 랜덤 포레스트를 다음과 같이 구현할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.