더북(TheBook)

  6 역주 결정 트리의 특성 중요도는 노드에 사용된 특성별로 (부모 노드의 샘플 비율 × 불순도) - (왼쪽 자식 노드의 샘플 비율 × 불순도) - (오른쪽 자식 노드의 샘플 비율 × 불순도)를 계산하여 더하고, 특성 중요도의 합이 1이 되도록 정규화한 것입니다. 여기에서 샘플 비율은 전체 샘플 수에 대한 비율입니다. 랜덤 포레스트의 특성 중요도는 각 결정 트리 특성 중요도의 합을 트리 수로 나눈 것입니다.

 

  7 역주 주성분은 고윳값의 크기로 정렬하기 때문에 첫 번째 주성분이 가장 큰 분산을 가집니다.

 

  8 PCA Versus LDA, A. M. Martinez and A. C. Kak, IEEE Transactions on Pattern Analysis and Machine Intelligence, 23(2): 228-233, 2001

 

  9 The Use of Multiple Measurements in Taxonomic Problems, R. A. Fisher, Annals of Eugenics, 7(2): 179-188, 1936

 

10 The Utilization of Multiple Measurements in Problems of Biological Classification, C. R. Rao, Journal of the Royal Statistical Society. Series B (Methodological), 10(2): 159-203, 1948

 

11 Pattern Classification 2nd Edition, R. O. Duda, P. E. Hart, and D. G. Stork, New York, 2001

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.