UNIT 07
정리
7장에서 다룬 dplyr 패키지의 주요 함수를 정리하면 다음 표와 같습니다.
기능 |
함수 |
설명 |
예시 |
행 요약 |
summarise() |
행 요약하기 |
summarise(order_info_r, avg = mean(sales)) |
group_by() |
행 그룹화하기 |
group_by(customer_id) |
|
행 조작 |
filter() |
조건으로 행 추출하기 |
filter(item_id == " M0001") |
distinct() |
중복 행 제거해서 반환하기 |
distinct(item_id) |
|
slice() |
선택 행 자르기 |
slice(2:4) |
|
arrange() |
행 정렬하기 |
arrange(sales) |
|
add_row() |
행 추가하기 |
add_row(order_no = "1", item_id = "1") |
|
sample_frac() |
무작위로 샘플 행 뽑기 |
sample_frac(0.1, replace = TRUE) |
|
열 조작 |
select() |
열 선택하기 |
select(reserv_no, sales) |
mutate() |
열 조작해서 새로운 열 생성하기 |
mutate(avg = mean(sales)) |
|
transmute() |
원래 열 빼고 새로운 열 생성하기 |
transmute(avg = mean(sales)) |
|
mutate_all() |
모든 열 조작해서 새로운 열 생성하기 |
mutate_all(funs(max)) |
|
mutate_if() |
특정 조건 열만 조작해서 새로운 열 생성하기 |
mutate_if(is.numeric, funs(log(.))) |
|
mutate_at() |
특정 열만 조작해서 새로운 열 생성하기 |
mutate_at(vars(sales), funs(max)) |
|
rename() |
열 이름 바꾸기 |
rename(amt = sales) |
|
테이블 조작 |
bind_cols() |
테이블 열 붙이기 |
bind_cols(order_info_r, tmp_order_info_r) |
bind_rows() |
테이블 행 붙이기 |
bind_rows(order_info_r, tmp_order_info_r) |
|
inner_join() |
일치하는 데이터 연결하기 |
inner_join(reservation_r, order_info_r, by = "reserv_no") |
|
left_join() |
왼쪽 기준 모든 데이터 연결하기 |
left_join(reservation_r, order_info_r, by = "reserv_no") |
|
right_join() |
오른쪽 기준 모든 데이터 연결하기 |
right_join(reservation_r, order_info_r, by = "reserv_no") |
|
full_join() |
양쪽 모든 데이터 연결하기 |
full_join(reservation_r, table_added_row, by = "reserv_no") |
|
intersect() |
데이터 교집합 구하기 |
intersect(reservation_r_reserv_no, order_info_r_reserv_no) |
|
setdiff() |
데이터 빼기 |
setdiff(reservation_r_reserv_no, order_info_r_reserv_no) |
|
union() |
중복 제거해서 데이터 합치기 |
union(reservation_r_reserv_no, order_info_r_reserv_no) |