더북(TheBook)

2.2.4 A와 B를 묶어 보기

B 사이트의 데이터로 비슷한 분석을 수행하면 pB의 사후확률분포를 알 수 있다. 우리가 정말로 궁금한 건 pA와 pB 간의 차이다. pA, pB 그리고 delta = pA - pB 모두를 한번에 추론해보자. PyMC의 deterministic 변수를 사용하여 이를 추론할 수 있다. 연습 삼아 다음과 같이 가정한다. pB = 0.04(사실 우리는 이것을 모르지만), 그래서 delta = 0.01, NB = 750(NA의 절반), 그리고 A 사이트에서 했던 것처럼 B 사이트도 시뮬레이션할 것이다.

 


import pymc as pm
figsize(12, 4)
 
# 다음 둘은 미지수다.
true_p_A = 0.05
true_p_B = 0.04
 
# 표본의 크기 다르지만 베이지안 분석에서는 문제가 되지 않는다.
N_A = 1500
N_B = 750
 
# 관측치를 생성한다.
observations_A = pm.rbernoulli(true_p_A, N_A)
observations_B = pm.rbernoulli(true_p_B, N_B)
print(“Obs from Site A: “, observations_A[:30].astype(int), ”…”)
print(“Obs from Site B: “, observations_B[:30].astype(int), ”…”)

 

 

결과

Obs from Site A: [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0] …
Obs from Site B: [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0] …

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.