앞 코드를 실행하면 그림 3-25와 같이 랜덤 포레스트의 트리 앙상블이 만든 결정 영역을 볼 수 있습니다.
▲ 그림 3-25 랜덤 포레스트가 학습한 붓꽃 데이터셋의 결정 경계
앞 코드에서 n_estimators 매개변수로 25개의 결정 트리를 사용하여 랜덤 포레스트를 훈련했습니다. 노드를 분할하는 불순도 지표로는 지니 불순도를 사용했습니다. 작은 훈련 데이터셋에서 소규모 랜덤 포레스트를 훈련하지만 사용법을 보이기 위해 n_jobs 매개변수를 사용했습니다. 이 매개변수는 컴퓨터의 멀티 코어를 사용해서 모델 훈련을 병렬화합니다(여기서는 두 개의 코어를 사용합니다).