파이 그래프(pie)
파이 그래프는 데이터의 비율을 표현하는 목적으로 흔히 사용된다. 다음은 파이 그래프를 그리기 위해 이 절에서 사용한 함수들을 설명한 표다.
pie : 파이 그래프를 그린다. |
pie(
x, # 숫자 벡터. 이 값이 파이 그래프의 영역으로 표시된다.
...
)
|
cut : 숫자들을 구간에 따라 분류해 팩터로 변환한다. |
cut( x, # 숫자 벡터 breaks # 구간을 저장한 벡터 또는 구간의 수 ) |
table : 분할표(교차표)12를 구한다. |
table(
... # 팩터로 해석할 수 있는 하나 이상의 객체
)
반환 값은 “table”의 인스턴스인 분할표다. 분할표에는 값이 배열 형태로 저장되어 있다. |
이 절에서는 Sepal.Length의 구간별 비율을 파이 그래프로 그려보기로 한다. 구간으로 데이터를 나누기 위해 cut( ) 함수를 사용한다. cut( )은 구간으로 나눌 숫자 벡터(x)와 구간(breaks)을 인자로 받는다. cut( )에서 구간들은 (start, end] 형태로 정의되며, (start, end]는 0 < x <= end를 의미한다.
1:10을 (0, 5], (5, 10]으로 나누는 예를 생각해보자. 이 경우 breaks에 c(1, 5, 10)을 지정하면 안 된다. 그러면 1이 어떤 구간에도 속하지 않게 되기 때문이다.
> cut(1:10, breaks=c(0, 5, 10))
[1] (0,5] (0,5] (0,5] (0,5] (0,5] (5,10] (5,10] (5,10] (5,10]
[10] (5,10]
Levels: (0,5] (5,10]
코드 실행 결과 데이터가 2개 레벨 (0, 5], (5, 10] 중 어느 곳에 속하는지를 나타내는 팩터가 반환되었다.
12 분할표(Contingency Table)란 값의 빈도를 변수들의 값에 따라 나누어 그린 표를 말한다. 이런 표에서는 변수들의 각 값에 따라 빈도가 계산되어 여러 변수가 ‘교차’한다고 해서 교차표라고도 부른다.