더북(TheBook)

유틸리티 함수

데이터 프레임은 분석할 데이터가 들어 있는 주요 데이터 타입이다. 분석할 데이터는 보통 파일 등에서 불러들이므로, 불러들인 데이터가 올바른 데이터 타입으로 저장되어 있는지 확인하는 것이 중요하다. 또, 데이터 프레임에는 분석할 데이터 전체가 저장되므로 데이터양이 많다. 따라서 이러한 데이터를 손쉽게 살펴보는 방법이 필요하다. 이 절에서는 데이터 프레임과 관련하여 참고할 만한 함수들을 설명한다.

표 2-22 데이터를 살펴보기 위한 유틸리티 함수

head : 객체의 처음 부분을 반환한다.

head(
  x,    # 객체
  n=6L  # 반환할 결과 값의 크기
)

반환 값은 x의 앞부분을 n만큼 잘라낸 데이터다.

tail : 객체의 뒷부분을 반환한다.

tail(
  x,    # 객체
  n=6L  # 반환할 결과 값의 크기
)

반환 값은 x의 뒷부분을 n만큼 잘라낸 데이터다.

View : 데이터 뷰어를 호출한다.

View(
  x,     # 데이터 프레임으로 강제 형 변환한 뒤 뷰어로 볼 데이터
  title  # 뷰어 윈도우의 제목
)

통상 R에서의 데이터 처리는 데이터 프레임을 기본 타입으로 하므로 데이터 프레임에 많은 양의 데이터가 저장된다. 따라서 작업 중 데이터 프레임을 화면에 출력하면 전체 데이터가 모두 출력되어 데이터를 읽기가 어렵다. 이 경우 데이터의 제일 앞부분만 살펴보는 데 head( )를, 뒷부분만 살펴보는 데 tail( )을 사용할 수 있다.

> d <- data.frame(x=1:1000)
> d
        x
1       1
2       2
3       3
4       4
5       5
6       6
...
995   995
996   996
997   997
998   998
999   999
1000 1000
> head(d)
  x
1 1
2 2
3 3
4 4
5 5
6 6
> tail(d)
        x
995   995
996   996
997   997
998   998
999   999
1000 1000

View( )는 행렬과 같은 모습을 한 데이터를 손쉽게 살펴보기 위한 화면을 띄워 보여주는 함수다. 그림 2-1은 앞선 예제의 1 ~ 1000 값이 저장된 데이터 프레임을 View(d) 명령으로 살펴보는 화면을 보여준다.

그림 2-1 데이터 뷰어
그림 2-1 데이터 뷰어
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.