더북(TheBook)

2 str( ) 함수: 데이터셋 구조 확인하기

str() 함수는 데이터셋의 구조를 출력합니다.

> str(iris)     # 데이터 구조 보기
'data.frame': 150 obs. of 5 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
$ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
$ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
$ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...

* 데이터 프레임 구조로 관측치(행) 150개와 변수(열) 다섯 개로 구성됩니다.

* 열 이름. num은 numeric인 숫자형을 의미합니다. 옆에 숫자들은 데이터 값들을 나타냅니다.

 

str() 함수를 사용하여 iris는 열 다섯 개와 행 150개로 구성되어 있으며, 데이터 프레임 구조라는 것을 알 수 있습니다. 각 열 이름과 클래스 데이터 값들도 확인할 수 있습니다.

 

이처럼 head(), tail(), str() 함수를 조합해서 사용하면 데이터가 어떤 구조로 데이터셋을 구성하는지 알기 쉽습니다. head(), tail(), str() 함수는 데이터 분석 작업을 할 때 매우 빈번하게 사용합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.