유틸리티 함수
데이터 프레임은 분석할 데이터가 들어 있는 주요 데이터 타입이다. 분석할 데이터는 보통 파일 등에서 불러들이므로, 불러들인 데이터가 올바른 데이터 타입으로 저장되어 있는지 확인하는 것이 중요하다. 또, 데이터 프레임에는 분석할 데이터 전체가 저장되므로 데이터양이 많다. 따라서 이러한 데이터를 손쉽게 살펴보는 방법이 필요하다. 이 절에서는 데이터 프레임과 관련하여 참고할 만한 함수들을 설명한다.
head : 객체의 처음 부분을 반환한다. |
head( x, # 객체 n=6L # 반환할 결과 값의 크기 ) 반환 값은 x의 앞부분을 n만큼 잘라낸 데이터다. |
tail : 객체의 뒷부분을 반환한다. |
tail( x, # 객체 n=6L # 반환할 결과 값의 크기 ) 반환 값은 x의 뒷부분을 n만큼 잘라낸 데이터다. |
View : 데이터 뷰어를 호출한다. |
View( x, # 데이터 프레임으로 강제 형 변환한 뒤 뷰어로 볼 데이터 title # 뷰어 윈도우의 제목 ) |
통상 R에서의 데이터 처리는 데이터 프레임을 기본 타입으로 하므로 데이터 프레임에 많은 양의 데이터가 저장된다. 따라서 작업 중 데이터 프레임을 화면에 출력하면 전체 데이터가 모두 출력되어 데이터를 읽기가 어렵다. 이 경우 데이터의 제일 앞부분만 살펴보는 데 head( )를, 뒷부분만 살펴보는 데 tail( )을 사용할 수 있다.
> d <- data.frame(x=1:1000) > d x 1 1 2 2 3 3 4 4 5 5 6 6 ... 995 995 996 996 997 997 998 998 999 999 1000 1000 > head(d) x 1 1 2 2 3 3 4 4 5 5 6 6 > tail(d) x 995 995 996 996 997 997 998 998 999 999 1000 1000
View( )는 행렬과 같은 모습을 한 데이터를 손쉽게 살펴보기 위한 화면을 띄워 보여주는 함수다. 그림 2-1은 앞선 예제의 1 ~ 1000 값이 저장된 데이터 프레임을 View(d) 명령으로 살펴보는 화면을 보여준다.