2.2.4 A와 B를 묶어 보기
B 사이트의 데이터로 비슷한 분석을 수행하면 pB의 사후확률분포를 알 수 있다. 우리가 정말로 궁금한 건 pA와 pB 간의 차이다. pA, pB 그리고 delta = pA - pB 모두를 한번에 추론해보자. PyMC의 deterministic 변수를 사용하여 이를 추론할 수 있다. 연습 삼아 다음과 같이 가정한다. pB = 0.04(사실 우리는 이것을 모르지만), 그래서 delta = 0.01, NB = 750(NA의 절반), 그리고 A 사이트에서 했던 것처럼 B 사이트도 시뮬레이션할 것이다.
import pymc as pm figsize(12, 4) # 다음 둘은 미지수다. true_p_A = 0.05 true_p_B = 0.04 # 표본의 크기는 다르지만 베이지안 분석에서는 문제가 되지 않는다. N_A = 1500 N_B = 750 # 관측치를 생성한다. observations_A = pm.rbernoulli(true_p_A, N_A) observations_B = pm.rbernoulli(true_p_B, N_B) print(“Obs from Site A: “, observations_A[:30].astype(int), ”…”) print(“Obs from Site B: “, observations_B[:30].astype(int), ”…”)
결과
Obs from Site A: [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0] … Obs from Site B: [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0] …