코드를 실행하면 다음과 같습니다.
n = 115 node), split, n, loss, yval, (yprob) * denotes terminal node 1) root 115 44 N (0.61739130 0.38260870) 2) sales_sum< 55.5 37 2 N (0.94594595 0.05405405) * 3) sales_sum>=55.5 78 36 Y (0.46153846 0.53846154) 6) sales_sum< 173 45 18 N (0.60000000 0.40000000) 12) visitor_sum>=5.5 19 1 N (0.94736842 0.05263158) * 13) visitor_sum< 5.5 26 9 Y (0.34615385 0.65384615) * 7) sales_sum>=173 33 9 Y (0.27272727 0.72727273) 14) visit_sum< 1.5 9 4 N (0.55555556 0.44444444) * 15) visit_sum>=1.5 24 4 Y (0.16666667 0.83333333) *
* 훈련 데이터는 142개 중 115개(약 80%)
* 1번 노드, 115개 중에서 N 값이라면 44개를 설명할 수 없음(즉, Y가 44개)
* 2번 노드, sales_sum이 55.5보다 작은 것이 37개 있고 N일 때 이 중에 설명할 수 없는 것은 2개(Y)
* 3번 노드, sales_sum이 55.5 이상인 것이 78개 있고 Y일 때 이 중에 설명할 수 없는 것은 36개(N)