더북(TheBook)

2 파이프 연산자(%>%): 데이터 전달하기

dplyr 패키지를 로딩하면 파이프 연산자를 사용할 수 있습니다. 파이프 연산자(%>%)는 체인 연산자(chain operator) 또는 줄여서 파이프라고도 하는데, 물길을 연결하는 파이프처럼 데이터와 데이터를 연결하는 dplyr 패키지의 핵심 연산자입니다. ‘데이터를 전달한다’고 생각해도 됩니다. 즉, 앞서 연산된 결괏값이나 데이터를 다음으로 전달하는 역할을 하는 것이 파이프 연산자입니다.

 

그림 7-1 | 파이프 연산자 원리

 

예를 들어 결과 A를 다음으로 전달하면 이 데이터를 받아 작업 B를 할 수 있습니다. 파이프 연산자를 여러 개 사용하면, 복잡한 결과라도 연결 고리를 거쳐 정리하면서 뒤로 전달하여 원하는 형태로 만들 수 있습니다. 논리도 코드도 이해하기 쉽게 만들 수 있다는 말입니다.

 

다음은 customer_r 데이터셋을 전달해서 count() 함수에 적용한 예시입니다. 지금부터는 Ctrl+Enter 로 코드를 실행한다는 내용은 생략합니다. 파란색 코드를 실행하면 됩니다.

# dplyr 패키지 count() 함수는 데이터를 세는 함수
customer_r %>% count()

# A tibble: 1 x 1
        n
    <int>
1    183

 

customer_r 데이터셋을 count() 함수로 전달해서 행 값 183개를 세었습니다. 파이프 연산자는 콘솔 창이나 소스 창에서 Ctrl+Shift+M 을 눌러 간단하게 입력할 수 있습니다.

 

그럼 본격적으로 데이터를 처리하는 주요 dplyr 패키지 함수들을 알아보겠습니다. 함수들은 단일로도 사용하지만, 파이프 연산자로 함수끼리 묶어서도 많이 사용합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.