더북(TheBook)

β의 모든 표본값은 0보다 크다. 사후확률이 0 주변에 집중되었다면 우리는 β = 0을 의심할 것이며, 이는 온도가 결함의 확률에 아무런 영향을 주지 않는다는 것을 암시한다. 마찬가지로 α 사후확률 값은 모두 음수이고, 0과는 거리가 멀다. 이는 α가 0보다 상당히 작다는 믿음이 옳다는 것을 의미한다. 데이터 너비에 관해, 우리는 진짜 모수가 무엇인지에 대해서는 매우 확신이 없다(비록 작은 표본 크기와 결함 대 비결함이 많이 겹치는 점을 고려하더라도 이런 불확신은 어쩌면 예상되는 것이다).

다음으로 온도의 특별한 값에 대한 기대확률(expected probability)을 살펴보자. 즉, 사후확률분포에서 구한 모든 표본에 대해 평균을 내어 p(ti)의 추정값을 얻는다.

 


t = np.linspace(temperature.min() - 5, temperature.max() + 5, 50)[:, None]
p_t = logistic(t.T, beta_samples, alpha_samples)
 
mean_prob_t = p_t.mean(axis=0)
 
figsize(12.5, 4)
 
plt.plot(t, mean_prob_t, lw=3, label=“결함에 대한 평균 사후확률”)
plt.plot(t, p_t[0, :], ls=”–”, label=“사후적 실현”)
plt.plot(t, p_t[-2, :], ls=”–”, label=“사후적 실현”)
plt.scatter(temperature, D, color=“k”, s=50, alpha=0.5)
plt.title(“두 가지 실현값을 포함한 결함확률의 사후적 기댓값”)
plt.legend(loc=“lower left”)
plt.ylim(-0.1, 1.1)
plt.xlim(t.min(), t.max())
plt.ylabel(“확률”)
plt.xlabel(“기온”);

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.