더북(TheBook)

05 | 데이터를 그룹으로 묶은 후 함수 호출하기

데이터 분석에서는 데이터 전체에 대해 함수를 호출하기보다는 데이터를 그룹별로 나눈 뒤 각 그룹별로 함수를 호출하는 일이 흔하다. 앞 절에서 설명한 tapply( ) 외에도 이런 목적에 특화된 패키지들이 있는데, doBy는 그중 잘 알려진 패키지다.

doBy 패키지에는 summaryBy( ), orderBy( ), sampleBy( )와 같이 특정 값에 따라 데이터를 처리하는 유용한 함수들이 있다. 다음은 이 함수들의 특징을 요약한 것이다.

표 4-16 doBy 패키지 함수들

함수

특징

doBy::summaryBy( )5

데이터 프레임을 컬럼 값에 따라 그룹으로 묶은 후 요약 값 계산

doBy::orderBy( )

지정된 컬럼 값에 따라 데이터 프레임을 정렬

doBy::sampleBy( )

데이터 프레임을 특정 컬럼 값에 따라 그룹으로 묶은 후 각 그룹에서 샘플(sample) 추출

doBy를 설치 및 로드해보자.

> install.packages("doBy")
> library(doBy)

5 ::은 네임스페이스(이름 공간; Namespace)를 표현하는 데 사용한다. doBy::summaryBy( )는 doBy 패키지의 summaryBy( )를 지칭한다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.