프로그래머를 위한 베이지안 with 파이썬: 2.3 우리의 모델이 적절한가?

▲ 그림 2-19 사후확률분포의 모수를 사용한 시뮬레이션 데이터셋

기반 데이터가 다르기 때문에 그림 2-19의 각 도표도 다르다. 그러나 데이터셋이 모두 같은 기본 모델에서 파생된 것은 확실하다. 무작위성으로 인해 데이터셋들은 다르게 보이며, 통계는 데이터셋을 하나로 묶어준다. 이 데이터셋이 우리가 원래 관측한 데이터와 (통계적으로) 유사해 보이는가?

우리는 우리의 모델이 얼마나 훌륭한지 평가하고 싶다. 물론 ‘훌륭하다’는 것은 주관적인 항목이므로 결과가 다른 모델에 상대적이어야 한다.

우리는 이것을 그래픽적으로 작업할 것이다. 그래서 덜 객관적인 방법처럼 보일 수 있다. 다른 방법은 우리 모델에 대해 통계적으로 요약한 베이지안 p-값을 사용하는 것이다. 빈도주의 통계에서 사용하는 p-값과 유사한 것이기도 하다. 베이지안 p-값은 여전히 주관적이다. 좋고 나쁨 사이의 적절한 구분이 임의적이기 때문이다. 젤먼(Gelman)은 그래픽 테스트가 p-값 테스트보다 더 명백하다고 강조한다.⁶ 우리도 동의하는 바다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.