2 group_by( ) 함수: 행 그룹화하기
group_by() 함수는 지정한 열을 기준으로 행을 그룹화합니다. 쉽게 표현하면 다음 그림과 같습니다.
그림 7-3 | group_by() 함수 원리
앞서 배운 summarise() 함수와 함께 응용해 보겠습니다. 다음은 예약 테이블(reservation_r)에서 고객 번호(customer_id)로 그룹화하여(group_by) 평균값(mean)을 구하는 예시입니다.
reservation_r %>% group_by(customer_id) %>% summarise(avg = mean(visitor_cnt)) # A tibble: 182 x 2 customer_id avg <chr> <dbl> 1 W1327595 3 2 W1327803 3 3 W1328432 4 4 W1328505 2.83 5 W1328786 1 6 W1328985 3 7 W1328993 4 8 W1329560 2 9 W1329954 2 10 W1329962 2 # ... with 172 more rows
* customer_id로 그룹화
* 요약 함수, 여기에서는 customer_id별로 visitor_cnt 평균값을 구합니다.