1 산점도 데이터 준비하기
지금부터 7장과 마찬가지로 실습용 데이터셋 파일(customer_R, reservation_R, order_info_R, item_R) 네 개를 사용해서 그래프를 그려 보겠습니다.
그래프를 그리려면 데이터셋을 그리기 적합한 형태로 가공해야 합니다. R 기본 함수와 dplyr 패키지를 이용하여 실습용 데이터셋을 그래프에 적합하게 정리해 보겠습니다. 먼저 inner_join() 함수를 사용해서 예약 정보 테이블과 주문 정보 테이블을 이너 조인해야 합니다. 이너 조인을 하면 주문 정보 테이블에는 예약 완료된 정보만 있으므로 자연스럽게 예약 완료된 예약 정보와 주문 완료된 주문 정보를 조인해서 연결합니다.
소스 창에서 다음 코드를 입력합니다.
# 소스 창에서 df_cfm_order <- inner_join(reservation_r, order_info_r, by = "reserv_no") %>% select(customer_id, reserv_no, visitor_cnt, cancel, order_no, item_id, sales) %>% arrange(customer_id, reserv_no, item_id) head(df_cfm_order) # 데이터셋 확인