UNIT 04
데이터 확인
데이터를 분석하려면 어떤 데이터로 데이터셋이 어떻게 구성되어 있는지 확인하는 작업이 중요합니다. 데이터가 적다면 사람의 눈으로 일일이 확인 가능하겠지만, 열 수십 개와 행 수천수만 개를 가진 데이터셋이라면 어떤 데이터들로 구성했는지 한눈에 알기가 매우 어려울 것입니다. R은 데이터셋을 쉽게 확인할 수 있는 다양한 함수를 제공하는데, 주요 함수는 다음 표와 같습니다.
표 6-7 | 데이터셋 확인하기 주요 함수
함수 |
설명 |
예시 |
head() |
데이터셋 앞부분 출력 |
head(x, 출력행 개수) |
tail() |
데이터셋 뒷부분 출력 |
tail(x, 출력행 개수) |
str() |
데이터셋 구조 출력 |
str(x) |
summary() |
요약 통계량 출력 |
summary(x) |
View() |
소스 창으로 데이터와 구조 확인 |
View(x) |
dim() |
열과 행, 차원의 개수를 셈 |
dim(x) |
ncol() |
열 개수를 셈 |
ncol(x) |
nrow() |
행 개수를 셈 |
nrow(x) |
length() |
벡터 길이를 반환, 리스트나 데이터 프레임에서도 사용 가능 |
length(x) |
ls() |
지정된 전체 변수(객체)를 보여 줌 |
ls() |
object.size |
메모리상에서 변수(객체) 데이터의 크기 확인 |
object.size(x) |
※ x는 데이터를 의미합니다.