더북(TheBook)

이 데이터를 그림으로 더 잘 표현할 수 있다. 나는 그림 2-20처럼 이 데이터를 separation_plot 함수로 나타냈다.

 


from separation_plot import separation_plot

figsize(11, 1.5)
separation_plot(posterior_probability, D)
plt.title("기온 종속적 모델")
plt.ylabel("예측")

 

092

▲ 그림 2-20 기온 종속적 모델

 

꾸불꾸불한 선은 정렬된 확률이다. 파란색 막대는 결함을 나타내고, 빈 공간(또는 낙관적인 독자를 위한 회색 막대)은 무결함을 나타낸다. 확률이 높아질수록 더욱 더 많은 결함이 발생하는 것을 알 수 있다. 그림 2-20은 사후확률이 클수록(1에 가까운 라인) 더 많은 결함이 발생한다는 것을 암시한다. 이는 좋은 움직임이다. 이상적으로는 파란색 막대가 모두 오른쪽 가까이에 있어야 한다. 그리고 이것으로부터 나온 편차는 손실된 예측을 의미한다.

이 모델에서 검은 수직선은 우리가 관측해야 하는 결함의 기대 개수다(계산 방법은 2.5 “부록” 절을 참고하라). 이렇게 하면 모델이 예측한 이벤트의 총 개수와 데이터에 있는 이벤트의 실제 개수를 비교할 수 있다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.