더북(TheBook)

정리된 고객 번호별 RFM 데이터(df_rfm_data)의 요약 통계 값을 확인해 보겠습니다.

summary(df_rfm_data)     # df_rfm_data 요약 통계 값 확인

     customer_id      visit_sum        sales_sum
Length:170        Min.   :1.000  Min.   :   6.00
Class :character  1st Qu.:1.000  1st Qu.:  40.75
Mode  :character  Median :1.000  Median : 100.00
                  Mean   :1.982  Mean   : 146.81
                  3rd Qu.:3.000  3rd Qu.: 192.00
                  Max.   :8.000  Max.   :1006.00

 

데이터 구조상 예약 및 주문 완료 횟수가 방문 횟수(F, visit_sum)라고 생각할 수 있습니다. 방문 횟수(F, visit_sum)의 평균(mean)은 1.98이지만 중앙값(median)은 1인 것으로 확인됩니다. 즉, 한 번만 방문한 고객이 다수이며, 많이 방문한 고객은 상대적으로 소수임을 알 수 있습니다. 매출(M, sales_sum)의 평균은 146이고 중앙값은 100인 것도 확인할 수 있습니다. 역시 소액 매출 고객이 다수이며 고액 매출 고객은 상대적으로 소수인 것을 짐작할 수 있습니다. 매출 기준으로 좀 더 살펴보면 25%에 위치하는 1사분위수는 40.75이고 75%에 위치하는 3사분위수는 192인 것이 확인되며, 이상치도 다소 존재함을 확인할 수 있습니다. 정리해 보면 다음과 같습니다.

 

방문 횟수(F)는 한 번 방문 고객이 다수입니다. 전체 평균 방문은 2회(1.98회)입니다.

매출(M)은 소액 고객이 다수입니다. 전체 평균 매출은 14만 6000원입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.