UNIT 05
데이터 조작
조작 함수는 데이터를 나누고 합치고 선택하고 변형합니다. 조작 작업은 데이터 처리의 기본이라고 할 수 있습니다. 조작 함수에서 제공하는 많은 기능은 뒤에 배울 dplyr 패키지에서도 제공합니다. 하지만 R에서 기본으로 제공하는 조작 함수에 무엇이 있는지 아는 것도 중요하기 때문에 주요 함수 위주로 살펴보겠습니다.
표 6-11 | 데이터 조작하기 주요 함수
함수 |
설명 |
예시 |
rbind() |
데이터 값을 행으로 취급하여 합침 |
rbind(x, y) |
cbind() |
데이터 값을 열로 취급하여 합침 |
cbind(x, y) |
split() |
분리할 열 팩터를 기준으로 분리 |
split(x, 분리할 기준열팩터) |
subset() |
조건식으로 데이터를 추출 |
subset(x, 조건식, select = [데이터 프레임의 경우 선택할 열]) |
substr() |
데이터에서 일부 문자열을 선택해서 추출 |
substr(데이터(열이름), 시작위치, 종료위치) |
merge() |
데이터 프레임을 행 이름이나 열 이름으로 합침 |
merge(합치려는 데이터프레임1, 합치려는 데이터프레임2) |
sort() |
데이터 값의 순서를 정렬, 기본은 오름차순 |
sort(x, [decreasing = FALSE 또는 TRUE]) |
order() |
데이터 값의 순서 인덱스를 반환, 기본은 오름차순 |
order(x, [decreasing = FALSE 또는 TRUE]) |
unique |
유일 값을 반환 |
unique(x) |
rm() |
변수(객체)를 삭제 |
rm(x) |
tapply |
기준으로 대상을 그룹화하여 통계를 적용 |
tapply(함수적용대상, 그룹기준, 적용할 통계) |
mapply |
대상에 통계를 적용 |
mapply(적용할 통계, 함수적용대상) |
aggregate() |
특정 열을 기준으로 다른 열의 합계, 평균 등 통계치를 계산 |
aggregate(기준열 ~ 그룹화할 열, x, 적용할통계) |