더북(TheBook)

3.6 간단한 분류 모델 #2: 나이브 베이즈, 확률, 깨진 약속들

또 다른 기본적인 분류 기법은 개념과 작동 원리에서 확률을 직접적으로 조정하는 나이브 베이즈 분류기입니다. 기본이 되는 확률 개념을 설명하기 위해 이야기를 하나 할까 합니다.

카지노에 확률적 게임을 하는 두 테이블이 있습니다. 각 테이블에서 여러분은 주사위와 카드 게임을 할 수 있습니다. 한 테이블의 확률은 공정하지만 다른 테이블은 조작되어 있습니다. 이들을 공정 테이블과 불공정 테이블이라고 하겠습니다. 불공정 테이블에 앉았다면 여러분이 굴린 주사위는 조작이 가해져 열 번 던지면 한 번만 6 눈이 나옵니다. 나머지는 1, 2, 3, 4, 5가 동일한 확률로 나옵니다. 카드를 플레이할 때는 상황이 더 좋지 않습니다. 불공정 테이블에는 킹, 퀸, 잭처럼 얼굴이 있는 카드가 없습니다. 이를 그림 3-6에 간단히 그려 보았습니다. 트집을 잡는 분들을 위해 주사위는 완전히 같게 보이고, 카드 덱은 불투명한 카드함 안에 들어 있어 여러분은 조작 흔적을 절대 구분할 수 없고 카드나 주사위를 직접 만질 수도 없습니다.

▲ 그림 3-6 카지노에 있는 공정·불공정한 테이블

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.