더북(TheBook)

1.6 부록

 

 

1.6.1 두 λ가 정말 다른지 통계적으로 알 수 있나?

우리는 문자 메시지 예제에서 λ1과 λ2의 사후확률분포를 시각적으로 조사하여 λ1과 λ2가 다르다는 것을 밝혔다. 두 사후확률분포의 위치가 상당히 떨어져 있다고 보는 게 타당했다. 만약 이게 사실이 아니라면? 만약 두 분포가 부분적으로 서로 겹친다면? 우리는 이런 결론을 어떻게 좀 더 규정할 수 있을까?

한 가지 방법은 P(λ1 < λ2|data)를 계산하는 것이다. 즉, 우리가 관측한 데이터가 주어진 상황에서 λ1의 진짜 값이 λ2보다 작을 확률이 얼마인가? 만일 이 숫자가 50%에 가깝다면, 동전을 던지는 것과 다름없다면, 그렇다면 우리는 두 값 사이에 정말로 차이가 있다는 것을 확신할 수 없다. 사후확률분포에서 얻은 표본을 사용하면 이런 계산은 간단하다. 우리는 λ1의 사후확률분포에서 얻은 표본이 λ2의 그것보다 작은 비율을 계산할 수 있다.

 


print(lambda_1_samples < lambda_2_samples)
# 불 배열: lambda_1이 lambda_2보다 작으면 True다.

 

 

결과

[ True  True  True …,  True  True  True]

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.