더북(TheBook)

데이터 필터링

다음 코드는 score >= 0.5라는 조건을 만족하는 df1의 행을 선택하고, idlevel 열을 선택한다.

> df1$score >= 0.5
[1] TRUE FALSE FALSE TRUE TRUE
> df1[df1$score >= 0.5, c("id", "level")]
    id    level
a    1        0
d    4       -1
e    5       -3

다음 코드는 이름이 a, d, e인 행들과 id, score 열을 골라낸다.

> rownames(df1) %in% c("a", "d", "e")
[1] TRUE FALSE FALSE TRUE TRUE
> df1[rownames(df1) %in% c("a", "d", "e"), c("id", "score")]
    id score
a    1   0.5
d    4   0.5
e    5   0.9

앞의 두 예제는 기본적으로 행을 선택할 때는 논리형 벡터를 사용하고, 열을 선택할 때는 문자형 벡터를 사용하는 행렬 표기법이다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.