더북(TheBook)

앞 코드를 실행하면 그림 3-24와 같이 랜덤 포레스트의 트리 앙상블이 만든 결정 영역을 볼 수 있습니다.

▲ 그림 3-24 랜덤 포레스트가 학습한 붓꽃 데이터셋의 결정 경계

앞 코드에서 n_estimators 매개변수로 25개의 결정 트리를 사용하여 랜덤 포레스트를 훈련했습니다. 기본적으로 노드를 분할하는 불순도 지표는 지니 불순도입니다. 작은 훈련 데이터셋에서 소규모 랜덤 포레스트를 훈련하지만 사용법을 보이기 위해 n_jobs 매개변수를 사용했습니다. 이 매개변수는 컴퓨터의 멀티 코어를 사용해서 모델 훈련을 병렬화합니다(여기에서는 두 개의 코어를 사용합니다). 컴퓨터가 다중 처리(multiprocessing)를 지원하지 않는 경우 이 코드에서 오류가 발생할 수 있습니다. 이 경우 n_jobs 매개변수를 생략하거나 n_jobs=None으로 설정하세요.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.