더북(TheBook)

2장 데이터 타입

R은 데이터 분석을 위한 언어다. 이런 이유로 다른 언어에서 흔히 사용하는 데이터 타입인 정수, 부동소수, 문자열에 더해 데이터 처리에 특화된 벡터, 행렬, 데이터 프레임, 리스트 등을 제공한다. 이 중 벡터는 여타 언어에서 사용하는 배열과 같은 개념이다. 행렬은 수학 시간에 흔히 배운 행렬과 의미가 같고, 행렬 간의 사칙 연산 등의 목적으로 사용한다. 데이터 프레임은 스프레드시트 형태로 정리된 데이터를 표현하는 데이터 타입으로, R에서 대부분의 함수가 사용하는 기본 데이터 타입이다. 리스트는 키와 값으로 구성된 해시 맵이 배열의 요소로 나열되어 있는 형태다. 즉, 크기 N인 배열이 있고, 각 요소가 해시 맵인 데이터 타입이 리스트다. R의 데이터 타입은 쉽지만 어렵다. 쉽다는 것은 다른 언어를 배우는 것처럼 하나씩 따라하면 그대로 사용할 수 있다는 의미고, 어렵다는 것은 문법이 생소하기에 프로그래밍 중에 데이터 처리 방법을 매번 기억해내기가 쉽지 않다는 의미다. 이 장에서 많이 사용하는 타입을 최대한 설명하고 있으니 실제 데이터 분석 과정에서 참고가 되기를 바란다.

01 변수

02 함수 호출 시 인자 지정

03 스칼라

04 벡터

05 리스트

06 행렬

07 배열

08 데이터 프레임

09 타입 판별

10 타입 변환

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.