더북(TheBook)

2.3 우리의 모델이 적절한가?

 

 

의심 많은 독자는 “당신은 p(t)에 대해 의도적으로 로지스틱함수를 선택했고 특정 사전확률을 선택했다. 아마 다른 함수 또는 다른 사전확률은 다른 결과를 줄 것이다. 내가 훌륭한 모델을 선택 했다는 것을 어떻게 아는가?”라고 말할 것이다. 이는 틀림없는 사실이다. 극단적인 상황을 고려하여 만약 내가 모든 t에 대해 항상 결함이 발생하는 함수 p(t) = 1을 선택했다면 어땠을까? 나는 다시 1월 28일에 참사를 예측했을 것이다. 이 모델은 명백히 좋지 않은 선택이다. 반면에, 내가 p(t)에 대해 로지스틱함수를 선택하고 모든 사전확률을 0 주변에 아주 가깝게 있도록 지정했다면 우리는 아마 매우 다른 사후확률분포를 얻었을 것이다. 우리의 모델이 데이터를 표현한다는 것을 어떻게 알 수 있을까? 그래서 모델의 우수성이나, 모델이 우리의 관측과 얼마나 적합한지를 측정할 것을 권장한다.

우리의 모델이 부적절한지 아닌지 어떻게 테스트할 수 있는가? 한 가지 방법은 관측 데이터(즉, 고정된 확률변수)와 우리가 시뮬레이션하는 인위적인 데이터셋을 비교하는 것이다. 이렇게 비교하는 근거는 시뮬레이션된 데이터셋이 관측된 데이터셋과 통계적으로 유사해 보이지 않는다면 우리의 모델은 관측된 데이터를 정확하게 나타내지 못할 수 있기 때문이다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.