더북(TheBook)

UNIT 06
dplyr 패키지 함수를 잘 사용하는 법

지금까지 살펴본 바와 같이 dplyr 패키지 함수의 문법은 R 기본(base) 함수보다 간결하고 직관적입니다. dplyr 패키지에는 소개한 함수 외에도 다양한 함수가 있지만, 사실 많이 사용하는 함수는 몇 가지 정도입니다. 이 책에서는 이것들을 dplyr 기초 함수라고 하겠습니다. dplyr 기초 함수는 다음 표와 같습니다.

 

표 7-2 | dplyr 기초 함수

함수

설명

group_by()

행을 그룹으로 묶기

summarise()

열 전체를 입력 값으로 해서 함수를 적용하여 요약

filter()

특정 조건을 만족하는 행 필터링

mutate()

기존 열에 조작을(함수를) 적용한 새로운 열 생성

select()

특정 열을 선택하여 출력

arrange()

기준 열로 데이터 정렬

 

dplyr 패키지로 데이터를 잘 조작하려면 dplyr 기초 함수를 사용해서 패턴을 생각해 보고, 논리(logic)에 따라 함수를 추가하거나 함수 순서를 바꾸어서 코드를 작성하면 됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.