모두의 R 데이터 분석: UNIT 06 의사 결정 나무: 어떤 고객이 스테이크를 주문할까?

패키지를 모두 설치하고 로드했다면 이제 다음 코드를 입력합니다.

# 난수를 생성할 때 계속 무작위수를 생성하지 않고 1만 번대 값을 고정으로 가져옴
set.seed(10000)

# 80% 데이터는 train을 위해 준비하고, 20% 데이터는 test를 위해 준비함
train_data <- createDataPartition(y = df_final_data$steak_order, p = 0.8, list = FALSE)
train <- df_final_data[train_data, ]
test <- df_final_data[-train_data, ]

# rpart를 사용해서 의사 결정 나무 생성
decision_tree <- rpart(steak_order~., data = train)

# decision_tree 내용 확인
decision_tree

* 데이터 나누기 함수입니다. df_final_data의 steak_order열을 기준으로 80%의 행 데이터를 나눕니다. list = FALSE는 리스트 구조로 출력하지 않겠다는 의미입니다.

* 훈련 데이터셋을 제외한 데이터입니다. 즉, 80% 외 20%를 의미합니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.