더북(TheBook)

2.2.3 간단한 예제

이 책은 프로그래머용이므로 웹 개발 예제를 계속 진행해보겠다. 우선 A 사이트 분석에 초점을 맞추겠다. A 사이트에 노출된 사용자가 궁극적으로 전환할 어떤 확률 pA가 있다고 가정하자. 이것이 A 사이트의 진정한 효율성이다. 지금 우리는 이 값을 알지 못한다.

A 사이트가 N명에게 노출되었고, n명이 전환했다고 가정하자. 누군가는 성급하게 pA = icon061_Nn이라는 결론을 내릴지도 모른다. 유감스럽지만 관측된 빈도 icon061_Nn이 반드시 pA와 같은 것은 아니다. 관측된 빈도와 사건의 실제 빈도 간에는 차이가 있다. 실제 빈도는 사건이 일어날 확률로 해석될 수 있으며, 이는 반드시 관측된 빈도와 같은 것은 아니다. 예를 들어 육면체 주사위를 굴려 1이 나오는 실제 확률은 icon061_61이지만, 주사위를 여섯 번 굴려서 1을 한 번도 관측하지 못할 수도 있다(관측된 빈도). 우리는 다음과 같은 사건의 실제 빈도를 알아야 한다.

구매를 하는 사용자의 비율

모집단에 어떤 특징의 비율

고양이를 키우는 인터넷 사용자의 비율

내일 비가 내릴 확률

안타깝지만 우리는 노이즈와 복잡성(complexities) 때문에 실제 빈도를 알지 못하고 관측된 데이터로 실제 빈도를 추론해야 한다. 우리는 베이지안 통계를 사용하여 적절한 사전확률 및 관측된 데이터를 사용하여 실제 빈도의 추정 값을 추론한다. 전환율 예제의 경우, 알고 있는 N(총 방문자 수)과 n(전환한 사람 수)을 사용하여 진정한 전환 빈도 pA가 얼마인지 추정하고자 한다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.