다음으로 데이터셋이 필요하다. 동전 던지기 인터뷰가 끝난 후 연구자들은 “예”라는 답변을 35개 얻었다. 이것으로 상대적인 평가를 한다고 했을 때 부정행위자가 정말로 없다면 모든 대답 중 평균 1/4이 “예”가 되어야 한다(첫 번째 동전이 뒷면이 될 가능성 1/2과 두 번째 동전이 앞면이 될 가능성 ½). 반면에, 모든 학생이 부정행위를 했다면 모든 대답 중 약 3/4이 “예”가 되어야 한다.
연구자들은 N = 100이고 value = 35인 p = observed_proportion 이항확률변수를 관찰한다.
X = 35 observations = pm.Binomial(“obs”, N, observed_proportion, observed=True, value=X)
다음으로 Model 컨테이너에 관심 있는 모든 변수를 추가하고, 모델링하여 우리의 블랙박스 알고리즘을 실행한다.
model = pm.Model([p, true_answers, first_coin_flips,second_coin_flips, observed_proportion, observations])
# 3장에서 설명할 예정
mcmc = pm.MCMC(model)
mcmc.sample(40000, 15000)
결과
[—————–100%—————–] 40000 of 40000 complete in 8.1 sec