05 | 데이터를 그룹으로 묶은 후 함수 호출하기
데이터 분석에서는 데이터 전체에 대해 함수를 호출하기보다는 데이터를 그룹별로 나눈 뒤 각 그룹별로 함수를 호출하는 일이 흔하다. 앞 절에서 설명한 tapply( ) 외에도 이런 목적에 특화된 패키지들이 있는데, doBy는 그중 잘 알려진 패키지다.
doBy 패키지에는 summaryBy( ), orderBy( ), sampleBy( )와 같이 특정 값에 따라 데이터를 처리하는 유용한 함수들이 있다. 다음은 이 함수들의 특징을 요약한 것이다.
함수 |
특징 |
doBy::summaryBy( )5 |
데이터 프레임을 컬럼 값에 따라 그룹으로 묶은 후 요약 값 계산 |
doBy::orderBy( ) |
지정된 컬럼 값에 따라 데이터 프레임을 정렬 |
doBy::sampleBy( ) |
데이터 프레임을 특정 컬럼 값에 따라 그룹으로 묶은 후 각 그룹에서 샘플(sample) 추출 |
doBy를 설치 및 로드해보자.
> install.packages("doBy") > library(doBy)
5 ::은 네임스페이스(이름 공간; Namespace)를 표현하는 데 사용한다. doBy::summaryBy( )는 doBy 패키지의 summaryBy( )를 지칭한다.