합, 비율의 계산

    여러 변수가 있을 때 한 변수만을 기준으로 총계를 구하는 경우를 생각해보자. 예를 들어, 다음은 변수 A, B에 대한 분할표다. 각 변수는 True, False 값을 가질 수 있다. 이 표에는 변수 B가 True, False인 경우의 합(100과 90)을 표시한 컬럼과, 변수 A가 True, False일 때 합을 표시한 총계 행(80과 110)이 표시되어 있다. 또, 전체 도수의 합 역시 표시되어 있다. 이러한 총계 컬럼 또는 행을 주변 합marginal sum이라고 한다. ‘주변’이란 데이터가 표시된 바깥쪽 행 또는 열에 값이 기록되기에 붙여진 이름이다.

    변수 A - True

    변수 A - False

    총계

    변수 B - True

    30

    70

    100

    변수 B - False

    50

    40

    90

    총계

    80

    110

    190

    주변 합이 계산되고 나면 이를 기준으로 비율을 계산할 수 있다. 예를 들어, 다음은 위에 보인 표에서 변수 B의 합을 기준으로 비율을 계산한 결과다.

    변수 A - True

    변수 A - False

    변수 B - True

    0.3 (= 30/100)

    0.7 (= 70/100)

    변수 B - False

    0.56 (= 50/90)

    0.44 (= 40/90)

    마찬가지로 변수 A의 합을 기준으로 비율을 구하거나 전체 데이터의 총 빈도(190)를 기준으로 비율을 계산할 수도 있다.

    주변 합과 주변 비율은 margin.table( ), prop.table( )로 계산한다.

    표 7-10 주변 합과 주변 비율

    margin.table : 분할표의 주변 합을 구한다.

    margin.table(
      x,  # 배열
      # 색인 번호. 1은 행 방향, 2는 열 방향을 뜻한다. 기본값인 NULL은 전체 값의 합을 구한다.
      margin=NULL
    )

    prop.table : 분할표의 주변 비율을 구한다.

    prop.table(
      x,
      margin=NULL
    )
    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.