패키지를 모두 설치하고 로드했다면 이제 다음 코드를 입력합니다.
# 난수를 생성할 때 계속 무작위수를 생성하지 않고 1만 번대 값을 고정으로 가져옴 set.seed(10000) # 80% 데이터는 train을 위해 준비하고, 20% 데이터는 test를 위해 준비함 train_data <- createDataPartition(y = df_final_data$steak_order, p = 0.8, list = FALSE) train <- df_final_data[train_data, ] test <- df_final_data[-train_data, ] # rpart를 사용해서 의사 결정 나무 생성 decision_tree <- rpart(steak_order~., data = train) # decision_tree 내용 확인 decision_tree
* 데이터 나누기 함수입니다. df_final_data의 steak_order열을 기준으로 80%의 행 데이터를 나눕니다. list = FALSE는 리스트 구조로 출력하지 않겠다는 의미입니다.
* 훈련 데이터셋을 제외한 데이터입니다. 즉, 80% 외 20%를 의미합니다.