더북(TheBook)

4.4 확률이란

우리 주변의 거의 모든 현상은 불확실하게 발생한다. 불확실하게 발생하는 정도를 수치화하여 표현하는 것을 확률이라고 부른다. 확률은 어떤 특정한 이벤트가 발생할 가능성을 숫자로 나타낸 값이며, 이벤트의 발생할 가능성을 의미한다. 이때 불확실한 정도를 수치화한 확률은 불확실성을 나타내는 측도(measure)로 0~1 사이의 값으로 표현한다.

예를 들어 어떤 무작위(random)한 실험에서 실험 결과가 항상 동일하게 나오지 않는데, 이 경우 우리는 불확실성이 있다고 하며, 그 불확실한 정도를 확률로 측정한다. 이렇게 불확실성이 있는 이벤트를 랜덤 이벤트(random event)라고 하는데, 이는 사건이 발생하기 전에는 어떠한 결과가 나타날지 미리 알 수 없는 사건이다. 이때 확률 계산의 원리는 이러한 랜덤 이벤트에서 각 실행의 결과가 무작위지만, 장기적으로 실행의 빈도수가 많아지면 어느 결과가 나타나는 것을 의미한다.

그리고 랜덤 이벤트의 정량적 표현(quantitative expression)이 바로 확률이다. 확률을 정의하기 위해서는 표본 공간(sample space)을 먼저 정의해야 하는데, 표본 공간은 통계 조사에서 얻을 수 있는 모든 결과의 집합 또는 실험이나 관측했을 때 출현 가능한 모든 결과의 집합이다. 그리고 이러한 표본 공간을 구성하는 각 원소를 표본점(sample point)이라고 부른다.

표본 공간은 이산형과 연속형으로 나눌 수 있는데, 이산형 표본 공간(discrete sample space)은 표본점의 수가 무한(infinite)개인 경우라도 하나씩 셀 수 있는 경우의 표본 공간을 의미한다. 예를 들어 동전을 던지는 경우를 생각하면 앞면과 뒷면만 가능하고, 주사위를 생각하면 1~6의 눈이 여기에 해당한다.

▲ 그림 4-7 동전과 주사위

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.