더북(TheBook)

데이터 역시 쓰임과 목적에 따라 관리하는 방법이 여러 가지입니다. 데이터는 특성에 적합한 구조로 관리해야 효율적으로 다룰 수 있는데, 데이터를 관리하는 구조를 데이터 (관리) 구조(datastructure)라고 합니다. 요리 재료와 마찬가지로 데이터 분석을 위한 데이터 개수도 역시 한 개 이상입니다. 많은 데이터를 효율적으로 관리하려면 데이터 구조가 꼭 필요합니다. R은 이름이 스칼라(scalar)4, 벡터(vector), 팩터(factor), 행렬(matrix), 배열(array), 리스트(list), 데이터 프레임(dataframe)인 데이터 구조로 데이터를 관리합니다. 각 데이터 구조의 특징을 간략하게 다시 정리하면 다음 표와 같습니다.

 

표 4-4 | 데이터 구조의 특징

구분

데이터 종류가 한 가지

데이터 종류가 여러 가지

1차원

벡터

리스트

2차원

행렬

데이터 프레임

n차원

배열

 

 


4 스칼라는 1 같은 단일 값을 의미합니다. 길이가 1인 벡터라고 생각해도 됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.