다음 코드들은 숫자 번호에 따라 차례대로 실행합니다.
① 테이블 조인하기
# 데이터 분석을 위해 원천 데이터 가공(전처리) # reserv_no를 키로 예약, 주문 테이블 연결 df_f_join_1 <- inner_join(reservation_r, order_info_r, by = "reserv_no") # item_id를 키로 df_f_join_1, 메뉴 정보 테이블 연결 df_f_join_2 <- inner_join(df_f_join_1, item_r, by = "item_id") head(df_f_join_2) # 테이블 세 개가 이너 조인된 것을 확인 # A tibble: 6 x 15 reserv_no reserv_date reserv_time customer_id branch visitor_cnt cancel order_no item_id quantity sales product_name <chr> <chr> <chr> <chr> <chr> <dbl> <chr> <chr> <chr> <dbl> <dbl> <chr> 1 20190827~ 20190827 1800 W1340914 마포 2 N 1908275~ M0001 2 48000 SPECIAL_SET 2 20190826~ 20190826 1200 W341658 동작 5 N 1908261~ M0010 5 30000 JUICE 3 20190826~ 20190826 1800 W1328993 강북 4 N 1908261~ M0005 4 140000 STEAK 4 20190825~ 20190825 1800 W1340463 용산 2 N 1908251~ M0008 2 20000 SANDWICH 5 20190824~ 20190824 1200 W1344912 강동 3 N 1908241~ M0006 3 75000 SALAD_BAR 6 20190823~ 20190823 1800 W1344753 영등포 2 N 1908231~ M0004 1 25000 SEA_FOOD # ... with 3 more variables: product_desc <chr>, category_id <chr>, price <dbl>
코드 풀이
분석을 위해 원천 데이터인 예약 정보, 주문 정보, 메뉴 정보 테이블을 이너 조인해서 합칩니다. head() 함수를 사용하여 데이터를 제대로 합쳤는지 확인하는 것도 잊지 마세요.