더북(TheBook)

5.2.3 결측 값 다루기

실제 데이터에는 NA로 표시되는 결측 값이 자주 등장한다. 다음 수치형 벡터가 간단한 예다.

> x <- c(-2, -3, NA, 2, 3, 1, NA, 0, 1, NA, 2)

결측 값으로 산술 연산을 하면 결과 역시 결측 값이 된다.

> x + 2
[1] 0 -1 NA 4 5 3 NA 2 3 NA 4

비슷하게 논리형 벡터에서도 TRUEFALSE 값뿐만 아니라 참과 거짓이 불분명한 상황을 고려하기 위해 NA 값을 허용해야 한다.

> x > 2
[1] FALSE FALSE NA FALSE TRUE FALSE NA FALSE FALSE NA FALSE

결론적으로 any()all() 등 논리 집계 함수 역시 결측 값을 고려한다.

> x
[1] -2 -3 NA 2 3 1 NA 0 1 NA 2
> any(x > 2)
[1] TRUE
> any(x < -2)
[1] TRUE
> any(x < -3)
[1] NA
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.