1.5.1 평균과 기댓값
평균은 어느 데이터를 대표하는 가상의 숫자다. ‘가상’이라고 하는 이유는 평균값이 실제 데이터의 값이 아니라 이를 모아서 계산한 값이기 때문이다.
보통 평균이라고 하면 산술평균을 가리키는데, 산술평균은 모든 자료 값을 더한 합계를 자료 개수로 나눈 값이다.
기댓값은 확률이 더해진 평균이다. 즉, 데이터 원소와 이에 대한 확률값을 곱해 더한 것이다.
정리하면 평균은 확률을 특별히 고려하지 않은 것이고, 기댓값은 사건이 일어날 것으로 예상되는 확률값이다. 가령 어느 날 일기예보에서 ‘오늘 비가 올 확률은 25%입니다’라고 말해주는 것도 실제 비가 오기 전에 우리가 비가 오는 사건을 기대하는 확률값을 의미한다.
주사위 값의 평균과 주사위를 한 번 던졌을 때 기대되는 값을 구해보자. 주사위에는 1~6까지의 수가 있고, 각 수가 나올 확률은 1/6로 동일하다. 여기서는 산술평균을 사용하며 1부터 6까지의 합계를 숫자의 개수인 6으로 나눈다.
평균 = (1 + 2 + 3 + 4 + 5 + 6)/6
= 21/6
= 3.5