더북(TheBook)

1.2.2 예제: 사서일까, 농부일까?

 

다음 이야기를 생각해보자. 이 이야기는 대니얼 카너먼의 <생각에 관한 생각(Thinking, Fast and Slow, 2011)>에서 영감을 받은 것이다.4 스티브는 수줍음이 많고 남을 잘 도와주는 사람이지만, 타인에게는 별로 관심이 없다. 그는 물건이 제 자리에 정리되어 있는 걸 좋아하고, 자신의 일에 매우 꼼꼼하다. 여러분은 스티브가 사서라고 생각하는가 아니면 농부라고 생각하는가? 스티브는 사서일 가능성이 더 커 보이고, 대다수의 사람들이 이 판단에 동의할 테지만, 이는 사서와 농부의 배경 분포를 무시하는 것이다. 남자 농부와 남자 사서의 비율은 20:1이다. 스티브는 통계적으로 농부일 가능성이 더 크다!

이런 오류를 어떻게 해결할까? 스티브는 실제로 농부일까 아니면 사서일까? 간단하게 세상에는 두 가지 직업, 즉 농부와 사서만 있다고 가정하자. 그리고 농부가 사서보다 20배 많다.

스티브가 사서인 사건을 A라고 하자. 만일 스티브에 대한 정보가 없다면 P(A) = 1/21 = 0.047이다. 이것이 사전확률이다. 이제 이웃에게서 그에 대한 정보를 얻었다고 가정하자. 이것을 X라고 부를 것이다. 우리는 P(A|X)를 알고 싶다. 베이즈 정리를 다시 꺼내보자.

우리는 P(A)를 알고 있지만, P(X|A)는 얼마일까? 이 값은 스티브가 사서라는 전제 하에 이웃이 스티브를 설명할 확률로 정의할 수 있다. 즉, 스티브가 사서라면 이웃이 이런 식으로 스티브를 설명할 가능성이 어느 정도일까? 아마도 거의 1.0에 가까울 것이다. 이를 95% 또는 0.95라고 하자.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.