UNIT 07
    정리

    7장에서 다룬 dplyr 패키지의 주요 함수를 정리하면 다음 표와 같습니다.

    기능

    함수

    설명

    예시

    행 요약

    summarise()

    행 요약하기

    summarise(order_info_r, avg = mean(sales))

    group_by()

    행 그룹화하기

    group_by(customer_id)

    행 조작

    filter()

    조건으로 행 추출하기

    filter(item_id == " M0001")

    distinct()

    중복 행 제거해서 반환하기

    distinct(item_id)

    slice()

    선택 행 자르기

    slice(2:4)

    arrange()

    행 정렬하기

    arrange(sales)

    add_row()

    행 추가하기

    add_row(order_no = "1", item_id = "1")

    sample_frac()

    무작위로 샘플 행 뽑기

    sample_frac(0.1, replace = TRUE)

    열 조작

    select()

    열 선택하기

    select(reserv_no, sales)

    mutate()

    열 조작해서 새로운 열 생성하기

    mutate(avg = mean(sales))

    transmute()

    원래 열 빼고 새로운 열 생성하기

    transmute(avg = mean(sales))

    mutate_all()

    모든 열 조작해서 새로운 열 생성하기

    mutate_all(funs(max))

    mutate_if()

    특정 조건 열만 조작해서 새로운 열 생성하기

    mutate_if(is.numeric, funs(log(.)))

    mutate_at()

    특정 열만 조작해서 새로운 열 생성하기

    mutate_at(vars(sales), funs(max))

    rename()

    열 이름 바꾸기

    rename(amt = sales)

    테이블 조작

    bind_cols()

    테이블 열 붙이기

    bind_cols(order_info_r, tmp_order_info_r)

    bind_rows()

    테이블 행 붙이기

    bind_rows(order_info_r, tmp_order_info_r)

    inner_join()

    일치하는 데이터 연결하기

    inner_join(reservation_r, order_info_r, by = "reserv_no")

    left_join()

    왼쪽 기준 모든 데이터 연결하기

    left_join(reservation_r, order_info_r, by = "reserv_no")

    right_join()

    오른쪽 기준 모든 데이터 연결하기

    right_join(reservation_r, order_info_r, by = "reserv_no")

    full_join()

    양쪽 모든 데이터 연결하기

    full_join(reservation_r, table_added_row, by = "reserv_no")

    intersect()

    데이터 교집합 구하기

    intersect(reservation_r_reserv_no, order_info_r_reserv_no)

    setdiff()

    데이터 빼기

    setdiff(reservation_r_reserv_no, order_info_r_reserv_no)

    union()

    중복 제거해서 데이터 합치기

    union(reservation_r_reserv_no, order_info_r_reserv_no)

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.