더북(TheBook)

R 프로그래밍을 배우는 과정에서 가장 먼저 해야 할 단계는 기본이 되는 R 객체(object)를 파악하고 다루는 데 익숙해지는 것이다.

이 장에서는 다음 주제를 함께 알아본다.

원소 벡터(예를 들어 수치형 벡터, 논리형 벡터, 문자형 벡터), 행렬, 배열, 리스트, 데이터 프레임을 생성하고 일부 요소를 선택하는 방법

함수를 정의하고 활용하는 방법

 

“존재하는 모든 것은 객체다. 일어나는 모든 일은 함수다.”

- 존 챔버스

우리는 종종 통계 분석에서 선형 회귀 모델에 데이터를 입력하고 선형 계수를 구하곤 한다.

이 작업을 할 때 R에는 여러 타입의 객체가 있다는 점을 염두에 둔 채, 실제로는 R 내부에서 어떤 일이 일어나는지 알아보자. 먼저 데이터셋을 저장하는 데이터 프레임 객체가 있고, 이를 선형 모델 함수에 넣으면 회귀 결과로 구성된 리스트 객체를 얻게 될 것이다. 마지막으로 이 리스트에서 선형 계수를 담은 또 다른 타입의 객체인 수치형 벡터를 추출한다.

모든 작업에는 다양한 타입의 객체가 관여하며 각 객체마다 다른 목표와 성격이 있다. 실제 문제를 좀 더 고급스럽고 몇 줄 안 되는 코드로 해결하려면, 기본 객체가 어떻게 동작하는지 이해하는 것이 중요하다. 더 중요한 사실은 객체 동작을 구체적으로 이해하게 되면, 정확한 코드를 만들기 위해 수많은 사소한 문제로 고생하는 것보다 문제 해결에 필요한 작업에 더 많은 시간을 할애할 수 있다는 것이다.

다음 절에서는 다양한 타입의 데이터를 나타내는 기본 객체를 살펴보고, 데이터셋을 쉽게 분석하고 시각화할 수 있는 방법을 알아본다. 객체 성질과 다른 객체 간의 활용 방법에 대한 기본 이해를 목표로 한다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.