더북(TheBook)

LESSON 09
학습과 예측하기

1 랜덤 포레스트 분류기

 

학습은 랜덤 포레스트를 사용해 진행하겠다. 랜덤 포레스트는 트리 기반의 알고리즘으로 결정트리를 여러 개 만들어 학습과 예측을 한다. 그래서 트리 기반의 하이퍼 파라미터를 가지고 있다.

먼저 사이킷런 라이브러리의 RandomForestClassifier()를 불러온다. 랜덤 포레스트 분류기는 다음과 같이 작성했다. (각 매개 변수의 내용은 TIP을 참고하기 바란다.)

 

n_estimators: 결정트리 개수를 지정한다.

n_estimators = 100: 100개의 트리로 이루어진 랜덤 포레스트 분류기로 학습할 것이다.

n_jobs: CPU 코어 사용 개수를 지정한다.

n_jobs = -1: -1로 설정해 사용할 수 있는 모든 CPU 코어를 사용할 것이다.

random_state: 수행할 때마다 같은 결과를 얻기 위해 설정한다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.