정리된 고객 번호별 RFM 데이터(df_rfm_data)의 요약 통계 값을 확인해 보겠습니다.
summary(df_rfm_data) # df_rfm_data 요약 통계 값 확인 customer_id visit_sum sales_sum Length:170 Min. :1.000 Min. : 6.00 Class :character 1st Qu.:1.000 1st Qu.: 40.75 Mode :character Median :1.000 Median : 100.00 Mean :1.982 Mean : 146.81 3rd Qu.:3.000 3rd Qu.: 192.00 Max. :8.000 Max. :1006.00
데이터 구조상 예약 및 주문 완료 횟수가 방문 횟수(F, visit_sum)라고 생각할 수 있습니다. 방문 횟수(F, visit_sum)의 평균(mean)은 1.98이지만 중앙값(median)은 1인 것으로 확인됩니다. 즉, 한 번만 방문한 고객이 다수이며, 많이 방문한 고객은 상대적으로 소수임을 알 수 있습니다. 매출(M, sales_sum)의 평균은 146이고 중앙값은 100인 것도 확인할 수 있습니다. 역시 소액 매출 고객이 다수이며 고액 매출 고객은 상대적으로 소수인 것을 짐작할 수 있습니다. 매출 기준으로 좀 더 살펴보면 25%에 위치하는 1사분위수는 40.75이고 75%에 위치하는 3사분위수는 192인 것이 확인되며, 이상치도 다소 존재함을 확인할 수 있습니다. 정리해 보면 다음과 같습니다.
• 방문 횟수(F)는 한 번 방문 고객이 다수입니다. 전체 평균 방문은 2회(1.98회)입니다.
• 매출(M)은 소액 고객이 다수입니다. 전체 평균 매출은 14만 6000원입니다.