2.2.3 간단한 예제
이 책은 프로그래머용이므로 웹 개발 예제를 계속 진행해보겠다. 우선 A 사이트 분석에 초점을 맞추겠다. A 사이트에 노출된 사용자가 궁극적으로 전환할 어떤 확률 pA가 있다고 가정하자. 이것이 A 사이트의 진정한 효율성이다. 지금 우리는 이 값을 알지 못한다.
A 사이트가 N명에게 노출되었고, n명이 전환했다고 가정하자. 누군가는 성급하게 pA = 이라는 결론을 내릴지도 모른다. 유감스럽지만 관측된 빈도
이 반드시 pA와 같은 것은 아니다. 관측된 빈도와 사건의 실제 빈도 간에는 차이가 있다. 실제 빈도는 사건이 일어날 확률로 해석될 수 있으며, 이는 반드시 관측된 빈도와 같은 것은 아니다. 예를 들어 육면체 주사위를 굴려 1이 나오는 실제 확률은
이지만, 주사위를 여섯 번 굴려서 1을 한 번도 관측하지 못할 수도 있다(관측된 빈도). 우리는 다음과 같은 사건의 실제 빈도를 알아야 한다.
• 구매를 하는 사용자의 비율
• 모집단에 어떤 특징의 비율
• 고양이를 키우는 인터넷 사용자의 비율
• 내일 비가 내릴 확률
안타깝지만 우리는 노이즈와 복잡성(complexities) 때문에 실제 빈도를 알지 못하고 관측된 데이터로 실제 빈도를 추론해야 한다. 우리는 베이지안 통계를 사용하여 적절한 사전확률 및 관측된 데이터를 사용하여 실제 빈도의 추정 값을 추론한다. 전환율 예제의 경우, 알고 있는 N(총 방문자 수)과 n(전환한 사람 수)을 사용하여 진정한 전환 빈도 pA가 얼마인지 추정하고자 한다.