이제 예약 번호에 스테이크 주문 여부를 붙일 차례입니다.
# 고객의 모든 예약 번호(A)에 대해 스테이크 주문한 예약 번호(B)를 레프트 조인 df_steak_order_1 <- left_join(df_rsv_customer, df_steak_order_rsv_no, by = "reserv_no") %>% group_by(customer_id) %>% # 고객 번호로 그룹화하여(182명) mutate(steak_order = ifelse(is.na(steak_order), "N", "Y")) %>% # 주문 여부가 NA이면 N, Y이면 Y로 바꿈 summarise(steak_order = max (steak_order)) %>% # 최댓값만 취함 arrange(customer_id) # 최종 정리된 고객별 스테이크 주문 여부 df_dpd_var <- df_steak_order_1 # 종속 변수, 최종 고객 182명의 스테이크 주문 여부 결과 확인 df_dpd_var
* ifelse(조건식, TRUE일 때 값, FALSE일 때 값)
* steak_order가 NA인지 여부, NA이면 TRUE를 반환하고 아니면 FALSE를 반환
* 최댓값을 구하는 함수
정리된 종속 변수 내용은 다음과 같습니다.
# A tibble: 182 x 2 customer_id steak_order <chr> <chr> 1 W1327595 Y 2 W1327803 Y 3 W1328432 Y 4 W1328505 N 5 W1328786 N 6 W1328985 Y 7 W1328993 Y 8 W1329560 N 9 W1329954 N 10 W1329962 N # ... with 172 more rows