더북(TheBook)

합, 비율의 계산

여러 변수가 있을 때 한 변수만을 기준으로 총계를 구하는 경우를 생각해보자. 예를 들어, 다음은 변수 A, B에 대한 분할표다. 각 변수는 True, False 값을 가질 수 있다. 이 표에는 변수 B가 True, False인 경우의 합(100과 90)을 표시한 컬럼과, 변수 A가 True, False일 때 합을 표시한 총계 행(80과 110)이 표시되어 있다. 또, 전체 도수의 합 역시 표시되어 있다. 이러한 총계 컬럼 또는 행을 주변 합marginal sum이라고 한다. ‘주변’이란 데이터가 표시된 바깥쪽 행 또는 열에 값이 기록되기에 붙여진 이름이다.

변수 A - True

변수 A - False

총계

변수 B - True

30

70

100

변수 B - False

50

40

90

총계

80

110

190

주변 합이 계산되고 나면 이를 기준으로 비율을 계산할 수 있다. 예를 들어, 다음은 위에 보인 표에서 변수 B의 합을 기준으로 비율을 계산한 결과다.

변수 A - True

변수 A - False

변수 B - True

0.3 (= 30/100)

0.7 (= 70/100)

변수 B - False

0.56 (= 50/90)

0.44 (= 40/90)

마찬가지로 변수 A의 합을 기준으로 비율을 구하거나 전체 데이터의 총 빈도(190)를 기준으로 비율을 계산할 수도 있다.

주변 합과 주변 비율은 margin.table( ), prop.table( )로 계산한다.

표 7-10 주변 합과 주변 비율

margin.table : 분할표의 주변 합을 구한다.

margin.table(
  x,  # 배열
  # 색인 번호. 1은 행 방향, 2는 열 방향을 뜻한다. 기본값인 NULL은 전체 값의 합을 구한다.
  margin=NULL
)

prop.table : 분할표의 주변 비율을 구한다.

prop.table(
  x,
  margin=NULL
)
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.