더북(TheBook)

벡터 생성

벡터는 c( )를 사용해 생성하고, names( )를 사용해 이름을 부여할 수 있다. 아래에 벡터 관련 함수를 정리했다.

표 2-4 벡터 관련 함수

c : 주어진 값들을 모아 벡터를 생성한다.

c(
   ...  # 벡터로 모을 R 객체들
)

반환 값은 벡터다.

names : 객체의 이름을 반환한다.

names(
   x  # 이름을 얻어올 R 객체 
)

반환 값은 x와 같은 길이의 문자열 벡터 또는 NULL이다.

names<- : 객체에 이름을 저장한다.2

names(
   x          # 이름을 저장할 R 객체 
) <- value # 저장할 이름

앞에서 설명한 함수들을 하나씩 알아보자. 벡터는 c( ) 안에 값을 나열하는 방법으로 생성한다. 다음 코드에서 x <- c(…) 부분이 다시 괄호 안에 쌓여 있음에 주목하기 바란다. 이렇게 괄호로 코드를 묶으면 괄호 안의 문장을 수행하고 그 결과 값을 다시 화면에 출력한다.

> (x <- c(1, 2, 3, 4, 5))
[1] 1 2 3 4 5

나열하는 인자들은 벡터의 정의대로 한 가지 유형의 스칼라 타입이어야 한다. 만일 서로 다른 타입의 데이터를 섞어서 벡터에 저장하면, 이들 데이터는 한 가지 타입으로 자동 형 변환된다. 이때 사용되는 형 변환 규칙은 좀 더 표현력이 높은 데이터 타입으로 변환하는 것이다.3

예를 들어, 정수와 부동소수가 섞여 있다면 모두 부동소수로 변환되며, 정수와 문자열이 섞여 있다면 모두 문자열로 변환된다. 예를 들어, 아래 코드에서 숫자형 데이터인 2는 “2”라는 문자열 형태로 자동으로 변환되어 x 안에는 문자열 형태의 데이터만 나열된다.

> (x <- c("1", 2, "3"))
[1] "1" "2" "3"

그러나 이런 형 변환 규칙을 모두 기억할 필요는 없다. 만약 서로 다른 데이터 타입으로 된 데이터를 다루고 싶다면 ‘2.5 리스트’ 절에서 다룰 리스트를 사용하고, 벡터에서는 늘 한 가지 데이터 타입만 사용하는 편이 낫다.

벡터는 중첩할 수 없다. 따라서 벡터 안에 벡터를 생성하면 단일 차원의 벡터로 변경된다. 중첩된 구조가 필요하다면 역시 리스트를 사용해야 한다.

> c(1, 2, 3)
[1] 1 2 3
> c(1, 2, 3, c(1, 2, 3))
[1] 1 2 3 1 2 3

연속된 숫자를 저장하는 벡터는 자주 사용되기 때문에 1, 2, 3, …과 같은 값을 저장한 벡터를 손쉽게 생성하는 별도의 문법이 있다. 이에 대해서는 ‘4.4 apply 계열 함수’ 절에서 설명한다.

벡터의 각 셀에는 names<-( ) 함수를 사용해 이름을 부여할 수 있다. names( )의 반환 값에 원하는 이름을 문자열 벡터로 할당하면 된다.

> x <- c(1, 3, 4)
> names (x) <- c("kim", "seo", "park")
> x
kim seo park
1 3 4

2 names( )는 값을 얻어오는 함수고, names<-( )는 값을 할당하는 함수다. 이 생소한 문법의 할당 함수가 다른 언어와 다른 점 중 하나다.

3 정확한 변환 규칙은 NULL < raw < logical < integer < double < complex < character < list < expression 순서다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.