더북(TheBook)

UNIT 05
데이터 조작

조작 함수는 데이터를 나누고 합치고 선택하고 변형합니다. 조작 작업은 데이터 처리의 기본이라고 할 수 있습니다. 조작 함수에서 제공하는 많은 기능은 뒤에 배울 dplyr 패키지에서도 제공합니다. 하지만 R에서 기본으로 제공하는 조작 함수에 무엇이 있는지 아는 것도 중요하기 때문에 주요 함수 위주로 살펴보겠습니다.

 

표 6-11 | 데이터 조작하기 주요 함수

함수

설명

예시

rbind()

데이터 값을 행으로 취급하여 합침

rbind(x, y)

cbind()

데이터 값을 열로 취급하여 합침

cbind(x, y)

split()

분리할 열 팩터를 기준으로 분리

split(x, 분리할 기준열팩터)

subset()

조건식으로 데이터를 추출

subset(x, 조건식, select = [데이터 프레임의 경우 선택할 열])

substr()

데이터에서 일부 문자열을 선택해서 추출

substr(데이터(열이름), 시작위치, 종료위치)

merge()

데이터 프레임을 행 이름이나 열 이름으로 합침

merge(합치려는 데이터프레임1, 합치려는 데이터프레임2)

sort()

데이터 값의 순서를 정렬, 기본은 오름차순

sort(x, [decreasing = FALSE 또는 TRUE])

order()

데이터 값의 순서 인덱스를 반환, 기본은 오름차순

order(x, [decreasing = FALSE 또는 TRUE])

unique

유일 값을 반환

unique(x)

rm()

변수(객체)를 삭제

rm(x)

tapply

기준으로 대상을 그룹화하여 통계를 적용

tapply(함수적용대상, 그룹기준, 적용할 통계)

mapply

대상에 통계를 적용

mapply(적용할 통계, 함수적용대상)

aggregate()

특정 열을 기준으로 다른 열의 합계, 평균 등 통계치를 계산

aggregate(기준열 ~ 그룹화할 열, x, 적용할통계)

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.