더북(TheBook)

UNIT 07
정리

7장에서 다룬 dplyr 패키지의 주요 함수를 정리하면 다음 표와 같습니다.

기능

함수

설명

예시

행 요약

summarise()

행 요약하기

summarise(order_info_r, avg = mean(sales))

group_by()

행 그룹화하기

group_by(customer_id)

행 조작

filter()

조건으로 행 추출하기

filter(item_id == " M0001")

distinct()

중복 행 제거해서 반환하기

distinct(item_id)

slice()

선택 행 자르기

slice(2:4)

arrange()

행 정렬하기

arrange(sales)

add_row()

행 추가하기

add_row(order_no = "1", item_id = "1")

sample_frac()

무작위로 샘플 행 뽑기

sample_frac(0.1, replace = TRUE)

열 조작

select()

열 선택하기

select(reserv_no, sales)

mutate()

열 조작해서 새로운 열 생성하기

mutate(avg = mean(sales))

transmute()

원래 열 빼고 새로운 열 생성하기

transmute(avg = mean(sales))

mutate_all()

모든 열 조작해서 새로운 열 생성하기

mutate_all(funs(max))

mutate_if()

특정 조건 열만 조작해서 새로운 열 생성하기

mutate_if(is.numeric, funs(log(.)))

mutate_at()

특정 열만 조작해서 새로운 열 생성하기

mutate_at(vars(sales), funs(max))

rename()

열 이름 바꾸기

rename(amt = sales)

테이블 조작

bind_cols()

테이블 열 붙이기

bind_cols(order_info_r, tmp_order_info_r)

bind_rows()

테이블 행 붙이기

bind_rows(order_info_r, tmp_order_info_r)

inner_join()

일치하는 데이터 연결하기

inner_join(reservation_r, order_info_r, by = "reserv_no")

left_join()

왼쪽 기준 모든 데이터 연결하기

left_join(reservation_r, order_info_r, by = "reserv_no")

right_join()

오른쪽 기준 모든 데이터 연결하기

right_join(reservation_r, order_info_r, by = "reserv_no")

full_join()

양쪽 모든 데이터 연결하기

full_join(reservation_r, table_added_row, by = "reserv_no")

intersect()

데이터 교집합 구하기

intersect(reservation_r_reserv_no, order_info_r_reserv_no)

setdiff()

데이터 빼기

setdiff(reservation_r_reserv_no, order_info_r_reserv_no)

union()

중복 제거해서 데이터 합치기

union(reservation_r_reserv_no, order_info_r_reserv_no)

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.