더북(TheBook)

이제 예약 번호에 스테이크 주문 여부를 붙일 차례입니다.

# 고객의 모든 예약 번호(A)에 대해 스테이크 주문한 예약 번호(B)를 레프트 조인
df_steak_order_1 <- left_join(df_rsv_customer, df_steak_order_rsv_no, by = "reserv_no") %>%
    group_by(customer_id) %>%                                       # 고객 번호로 그룹화하여(182명)
    mutate(steak_order = ifelse(is.na(steak_order), "N", "Y")) %>%  # 주문 여부가 NA이면 N, Y이면 Y로 바꿈
    summarise(steak_order = max (steak_order)) %>%                  # 최댓값만 취함
    arrange(customer_id)

# 최종 정리된 고객별 스테이크 주문 여부
df_dpd_var <- df_steak_order_1

# 종속 변수, 최종 고객 182명의 스테이크 주문 여부 결과 확인
df_dpd_var

* ifelse(조건식, TRUE일 때 값, FALSE일 때 값)

* steak_order가 NA인지 여부, NA이면 TRUE를 반환하고 아니면 FALSE를 반환

* 최댓값을 구하는 함수

 

정리된 종속 변수 내용은 다음과 같습니다.

# A tibble: 182 x 2
    customer_id  steak_order
    <chr>        <chr>
 1  W1327595     Y
 2  W1327803     Y
 3  W1328432     Y
 4  W1328505     N
 5  W1328786     N
 6  W1328985     Y
 7  W1328993     Y
 8  W1329560     N
 9  W1329954     N
10  W1329962     N
# ... with 172 more rows
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.