이러한 관측값 간의 차이는 집중화 경향만으로는 알기가 어렵다. 그래서 집중화 경향이 보여주는 요약 정보 외에 또 다른 요약 정보가 필요하다. 바로 앞서 살펴본 산포도이다. 이 예처럼 자료를 대표값으로 요약, 정리하는 것만으로는 자료를 충분히 이해할 수 없다. 그렇기 때문에 자료에서 관측값이 얼마나 퍼져있는가를 측정하는 척도인 산포도를 고려할 수 있으며, 이러한 산포도는 자료에서 관측값들이 변화하는 크기인 변동량을 나타내는 값을 나타낸다. 산포도가 나타내는 값이 퍼진 정도라는 것은 어떤 기준을 필요로 한다. 그때에는 집중화 경향의 요약 값을 기준으로 각 관측값이 얼마나 퍼져 있는지를 살펴볼 수 있다. 그렇다면 산포도로는 모든 것이 설명될까? 그렇지는 않다. 여전히 더 알아야 할 정보가 있고 이는 또 다른 통계량으로 파악해야 한다. 하지만 일반적으로 집중화 경향과 산포도를 많이 사용하니 이 책에서도 이 두 종류의 통계량만 소개한다.
가장 쉽게 접할 수 있는 산포도로, 범위(range)가 있다. 범위는 관측값 중 가장 큰 값인 최댓값(max)과 가장 작은 값인 최솟값(min)의 차이를 나타내며, 최댓값-최솟값으로 구할 수 있다. 값이 아무리 많더라도 최댓값, 최솟값 두 관측값만 이용하므로 모든 관측값의 크기가 반영되지 못하고, 이상값에 크게 영향 받는다는 단점이 있다. 이처럼 이상값에 영향받으면 관측값의 분포에 대해 잘 설명하기가 어려워진다. 특히 관측값의 산포도 중에서도 어디로 치우쳤는지를 살펴보는 것이 중요할 수 있다. 그래서 이상값에 영향받지 않고 관측값의 분포를 파악하려면 다른 통계량을 이용하는 것을 고려해보자.
바로 백분위수(percentile)이다. 백분위수는 크기에 따라 순서대로 나열한 관측값을 100 등분한 수이고, X 분위값은 관측값이 X%보다 작거나 같게 되는 값이다. 아주 크거나 아주 작은 값이 있다 하더라도 관측값을 크기 순서로 나열하여 100 등분했기 때문에 이상값에 영향을 덜 받는다. 특히 그중에서 X를 25, 50, 75로 하게 되는 것을 사분위수(quartile)라고 하며, 이는 백분위수가 25%, 50%, 75%인 경우를 의미한다. 이중에서 50%인 백분위수만 따로 놓고 보면 집중화 경향의 중앙값과 같은 것을 알 수 있다.