inner_join() 함수를 사용해서 customer_r 테이블의 customer_id를 키로 연결합니다.
# 성별 추가 df_sct_graph2 <- inner_join(df_sct_graph, customer_r, by = "customer_id") %>% select(vst_cnt, cust_amt, sex_code) head(df_sct_graph2) # 데이터셋 확인
코드를 실행하면 결과는 다음과 같습니다.
# A tibble: 6 x 3 vst_cnt cust_amt sex_code <dbl> <dbl> <chr> 1 6 188 M 2 6 210 M 3 20 246 M 4 20 287 F 5 1 10 M 6 8 178 M
성별 정보(sex_code)가 연결되었습니다. 이제 성별에 대해 색을 적용해 보겠습니다.
# 그룹별로 색상 적용 ggplot(data = df_sct_graph2, aes(x = vst_cnt, y = cust_amt, color = sex_code)) + geom_point() + xlim(0, 50) + ylim(0, 500)
* 색상 적용 기준이 되는 열