더북(TheBook)

길들을 그려 보면 그림 2-1과 같습니다. 확률을 세어 보면 전체 게임에서 빨간 공은 다섯 번, 파란 공은 세 번 뽑습니다. 즉, P(빨간공) = 입니다. 간단하네요. 맞죠? 잠깐만요, 진정하세요! 이렇게 세는 방식은 각 단계가 동일한 확률을 가진 경우에만 제대로 동작합니다. 우리가 가진 동전에 뭔가 이상이 있어 1000번 던지면 999번이 항아리 UI을 선택했다고 합시다. 그러면 빨간 공을 뽑는 확률은 UI에서 빨간 공을 뽑는 확률과 매우 비슷하게 될 것입니다. 즉, 항아리 UII의 존재를 거의 무시하는 것과 비슷한 결과가 되는 것이죠. 이러한 차이점을 감안해야 하며, 이 과정에서 얻을 수 있는 갱신된 정보를 사용해야 합니다.

이번에는 조금 다른 상황입니다. 이미 동전을 던져 앞이 나왔기 때문에 항아리 UI을 고른 상태입니다. 이때 빨간 공을 뽑는 확률은 이전과 다릅니다. 우리가 UI 에서 빨간 공을 뽑는 확률은 입니다. 수식으로는 P(빨간공 | UI) = 입니다. 세로막대 |는 “x가 일어났을 때(given)”라는 의미입니다. 조건부(머신 러닝과 통계학에서 주로 사용하는 표현)는 발생할 수 있는 단순 사건의 하위 집합에 문제를 한정합니다. 이 경우 조건은 동전을 던져 앞이 나오는 경우가 되는 것이지요.

항아리 UI에서 빨간 공을 뽑을 확률은 얼마일까요? 이를 계산하기 위해서는 (1) 동전을 던져 앞이 나와 항아리 UI을 골라야 하고 (2) 빨간 공을 뽑아야 합니다. 동전을 던지는 것이 항아리 UI 사건에 영향을 주지는 않습니다. 동전을 던져 뽑는 것은 항아리 UI이지 그 안에 든 공은 아니니까요. 두 사건이 서로 독립이므로, 둘의 확률을 곱해 두 사건이 발생할 결합 확률을 구할 수 있습니다. 그러므로 P(빨간공과 UI) = P(빨간공 | UI)P(UI ) = · = 입니다. 순서가 조금 이상해 보일 수도 있습니다. UI에 의존하는 사건을 먼저, 그리고 UI을 그다음에 썼습니다. 수식은 보통 이 순서로 되어 있습니다. 왜 그럴까요? 가장 큰 이유는 | UIP(UI ) 옆에 쓸 수 있기 때문입니다. 다이어그램을 볼 때 아래에서 위로 올라가는 식이라고 생각하면 이해하기 쉽습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.