더북(TheBook)

UNIT 31
통계적 추정

1 평균, 중앙값, 최빈값

 

통계를 이해하려면 대푯값, 평균, 중앙값과 최빈값이라는 용어를 알아야 합니다.

 

대푯값

대푯값은 데이터를 가장 잘 설명하는 대표적인 값을 의미합니다. 수만 건에 달하는 데이터가 있을 때 이를 일일이 확인하는 것은 효율적이지 않습니다. 데이터가 무엇을 의미하는지가 중요한데, 이를 효과적으로 표현할 수 있는 것이 대푯값입니다. 가장 자주 쓰는 대푯값으로 평균, 중앙값과 최빈값이 있습니다.

 

평균

평균은 집단에서 중심 경향을 나타내는 수학적 척도로, 표본을 모두 더한 후 표본 개수로 나눈 값입니다. 이를 수학적으로 표현하면 다음과 같습니다.

 

 

예를 들어 1, 1, 3, 5, 6, 7, 8, 9, 10이라는 데이터가 있을 때, 수학적으로 계산하면 = 5.6(소수점 둘째자리에서 반올림)이므로 평균은 5.6입니다.

 

평균은 모든 자료 값을 사용할 수 있다는 장점이 있지만, 극단적인 자료 값을 사용하면 대푯값이 왜곡될 수 있다는 단점이 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.