더북(TheBook)

2.2.5 예제: 거짓말에 대한 알고리즘

소셜 데이터는 흥밋거리를 추가로 제공한다. 사람들이 항상 정직하게 답변하는 것은 아니며, 이는 추론을 더 복잡하게 만든다. 예를 들어 사람들에게 “시험에서 부정행위를 한 적이 있는가?”라고 물어보면 분명 답변에 어느 정도 거짓말이 섞여 있을 것이다. 확실하게 말할 수 있는 것은 솔직한 답변의 실제 비율은 여러분이 관측한 데이터보다 적다는 것이다(사람들이 부정행위에 대해서만 거짓 답변을 한다고 가정한다. 부정행위를 하지 않았는데 했다고 주장하는 사람이 있다고는 생각하지 않는다).

이러한 솔직하지 못한 답변 문제를 우회하는 세련된 해결책을 제시하면서 베이지안 모델링을 보여주기 위해 우선 이항분포를 소개하고자 한다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.