R 프로그래밍을 배우는 과정에서 가장 먼저 해야 할 단계는 기본이 되는 R 객체(object)를 파악하고 다루는 데 익숙해지는 것이다.
이 장에서는 다음 주제를 함께 알아본다.
• 원소 벡터(예를 들어 수치형 벡터, 논리형 벡터, 문자형 벡터), 행렬, 배열, 리스트, 데이터 프레임을 생성하고 일부 요소를 선택하는 방법
• 함수를 정의하고 활용하는 방법
“존재하는 모든 것은 객체다. 일어나는 모든 일은 함수다.”
- 존 챔버스
우리는 종종 통계 분석에서 선형 회귀 모델에 데이터를 입력하고 선형 계수를 구하곤 한다.
이 작업을 할 때 R에는 여러 타입의 객체가 있다는 점을 염두에 둔 채, 실제로는 R 내부에서 어떤 일이 일어나는지 알아보자. 먼저 데이터셋을 저장하는 데이터 프레임 객체가 있고, 이를 선형 모델 함수에 넣으면 회귀 결과로 구성된 리스트 객체를 얻게 될 것이다. 마지막으로 이 리스트에서 선형 계수를 담은 또 다른 타입의 객체인 수치형 벡터를 추출한다.
모든 작업에는 다양한 타입의 객체가 관여하며 각 객체마다 다른 목표와 성격이 있다. 실제 문제를 좀 더 고급스럽고 몇 줄 안 되는 코드로 해결하려면, 기본 객체가 어떻게 동작하는지 이해하는 것이 중요하다. 더 중요한 사실은 객체 동작을 구체적으로 이해하게 되면, 정확한 코드를 만들기 위해 수많은 사소한 문제로 고생하는 것보다 문제 해결에 필요한 작업에 더 많은 시간을 할애할 수 있다는 것이다.
다음 절에서는 다양한 타입의 데이터를 나타내는 기본 객체를 살펴보고, 데이터셋을 쉽게 분석하고 시각화할 수 있는 방법을 알아본다. 객체 성질과 다른 객체 간의 활용 방법에 대한 기본 이해를 목표로 한다.