더북(TheBook)

예를 들어 다음 과제가 있다면 dplyr 패키지를 이용하여 코드처럼 작성할 수 있습니다.

reservation_r 테이블에서 평균 방문 고객 수(visitor_cnt)가 세 명 이상인 고객을 구하되, 평균 방문 고객 수가 높은 고객부터 출력하세요.

reservation_r %>%
    group_by(customer_id) %>%
    summarise(avg = mean(visitor_cnt)) %>%
    filter(avg >= 3) %>%
    arrange(desc(avg))

# A tibble: 113 x 2
   customer_id   avg
   <chr>        <dbl>
 1  W357565     13.5
 2  W1373867      12
 3  W359156       12
 4  W365779       12
 5  W363739     11.3
 6  W1375678      11
 7  W335138        9
 8  W346987        9
 9  W1356560    8.67
10  W1375244     8.5
# ... with 103 more rows
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.