더북(TheBook)

코드를 실행하면 다음과 같습니다.

n = 115

node), split, n, loss, yval, (yprob)
      * denotes terminal node

1) root 115 44 N (0.61739130 0.38260870) 
  2) sales_sum< 55.5 37 2 N (0.94594595 0.05405405) *
  3) sales_sum>=55.5 78 36 Y (0.46153846 0.53846154)
    6) sales_sum< 173 45 18 N (0.60000000 0.40000000)
      12) visitor_sum>=5.5 19 1 N (0.94736842 0.05263158) *
      13) visitor_sum< 5.5 26 9 Y (0.34615385 0.65384615) *
    7) sales_sum>=173 33 9 Y (0.27272727 0.72727273)
      14) visit_sum< 1.5 9 4 N (0.55555556 0.44444444) *
      15) visit_sum>=1.5 24 4 Y (0.16666667 0.83333333) *

* 훈련 데이터는 142개 중 115개(약 80%)

* 1번 노드, 115개 중에서 N 값이라면 44개를 설명할 수 없음(즉, Y가 44개)

* 2번 노드, sales_sum이 55.5보다 작은 것이 37개 있고 N일 때 이 중에 설명할 수 없는 것은 2개(Y)

* 3번 노드, sales_sum이 55.5 이상인 것이 78개 있고 Y일 때 이 중에 설명할 수 없는 것은 36개(N)

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.