더북(TheBook)

inner_join() 함수를 사용해서 customer_r 테이블의 customer_id를 키로 연결합니다.

# 성별 추가
df_sct_graph2 <- inner_join(df_sct_graph, customer_r, by = "customer_id") %>%
    select(vst_cnt, cust_amt, sex_code)

head(df_sct_graph2)     # 데이터셋 확인

 

코드를 실행하면 결과는 다음과 같습니다.

# A tibble: 6 x 3
 vst_cnt  cust_amt  sex_code
   <dbl>     <dbl>  <chr>
1      6       188  M
2      6       210  M
3     20       246  M
4     20       287  F
5      1        10  M
6      8       178  M

 

성별 정보(sex_code)가 연결되었습니다. 이제 성별에 대해 색을 적용해 보겠습니다.

# 그룹별로 색상 적용
ggplot(data = df_sct_graph2, aes(x = vst_cnt, y = cust_amt, color = sex_code)) +
    geom_point() +
    xlim(0, 50) +
    ylim(0, 500)

* 색상 적용 기준이 되는 열

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.