더북(TheBook)

1.3.1 이산적인 경우

Z가 이산적이라면 그 분포를 확률질량함수(probability mass function)라고 한다. 확률질량함수는 Z가 특정값 k를 취할 때 확률, 즉 P(Z = k)를 나타낸다. 확률질량함수는 확률변수 Z를 완벽하게 설명한다. 즉, 질량함수를 안다면 Z가 어떻게 움직일지도 안다. 확률질량함수가 계속 나올 텐데, 이는 필요할 때마다 소개할 것이다. 여기서는 가장 유용한 확률질량함수를 소개하겠다. 만일 다음 수식을 만족한다면 Z는 푸아송분포(Poisson-distribution)를 따른다고 말한다.

5m-1

λ는 분포의 모수이며 분포 모양을 결정한다. 푸아송분포에서 λ는 양수다. λ를 늘리면 큰 값에 더 많은 확률을 부여하고, 역으로 λ를 줄이면 작은 값에 더 많은 확률을 부여한다. λ는 푸아송분포의 밀도(intensity)를 나타낸다.

양수인 λ와 달리 앞선 수식의 k는 음수가 아닌 정수(즉, 0, 1, 2 …)여야 한다. 이는 매우 중요한데 인구 모델을 구하는 경우 4.25명이나 5.612명 같은 인구는 이치에 맞지 않기 때문이다.

만약 확률변수 Z가 푸아송 질량분포를 따른다면 다음과 같이 나타낼 수 있다.

6m-1

푸아송분포의 유용한 속성 한 가지는 그 기댓값이 모수와 같다는 점이다. 즉,

7m-1

이 속성을 자주 이용할 것이므로 기억해두기 바란다. 그림 1-3에 여러 다른 λ값에 대한 확률질량함수를 그래프로 나타내었다. 첫 번째로 주목할 점은 λ가 증가함에 따라 더 큰 값이 나오는 사건에 더 많은 확률을 추가한다는 점이다. 두 번째로 주목할 점은 x축이 15에서 끝났지만, 분포는 그렇지 않다는 점이다. 분포는 음이 아닌 모든 정수에 양의 확률을 부여한다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.