더북(TheBook)

최빈값(mode)은 한 변수에 속한 값 중에서 가장 많이 출현하는 관측값을 의미한다. 예를 들어 10명의 성별을 조사할 때 성별 값은 숫자가 아닌 ‘남성’ 또는 ‘여성’이다. 이러한 숫자가 아닌 값을 명목 자료라고 부르는데, 명목 자료인 경우에는 평균과 중앙값은 계산되지 않는다(10개의 ‘여성’ 또는 ‘남성’ 값을 더해서 10으로 나눌 수가 없음). 이 경우 우리는 최빈값을 구할 수 있다. 최빈값은 한 개일 수도 있으며, 혹은 두 개 이상 존재할 수도 있다.

지금까지 살펴본 통계량은 바로 집중화 경향에 속하는 것이었다. 한 변수에 값이 100개나 1,000개가 있을 때 집중화 경향에 속하는 통계량으로 요약하면 적은 수의 요약 값으로 관측값이 대략 어느 정도인지를 이해하는 데 큰 도움이 된다. 다음의 경우를 생각해보자.

학생이 3명씩 있는 두 학급이 있을 때 각 학급의 수학 시험의 결과를 살펴보자. 1반은 60, 70, 80점을 받아 평균이 70이고, 2반은 40, 70, 100점을 받아 평균이 70이다. 두 반 모두 평균은 70이다. 하지만 실제 점수의 분포를 보면 1반 학생들은 모두 10점 차이로 수학 점수를 받은 반면에, 2반 학생들은 30점 차이로 점수를 받았다. 그런데 평균이 같다니!

▲ 그림 4-4 두 학급의 성적 비교

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.