4.9 핵심 요약
1. 모집단과 표본
- 통계: 분석의 대상이 되는 집단에 대하여 실시한 조사 및 실험 결과로 얻어진 관측값(수치) 또는 관측값의 요약된 형태이다.
- 통계학: 특정 의도나 목적으로 조사, 연구할 때 자료 수집 방법 및 수집한 자료를 과학적이고 논리적인 이론에 의하여 정리하고 분석하는 학문이다.
- 모집단: 얻고자 하는 정보와 관련 있는 모든 개체로부터 얻을 수 있는 모든 관측값의 집합, 관심을 갖는 대상 전체이다.
- 표본: 모집단의 일부분으로, 원하는 정보를 얻기 위해 수행한 관측을 통해 얻어진 관측값이다.
2. 통계량
- 집중화 경향: 관측값이 어느 위치에 집중되어 있는가를 나타낸다.
- 산포도: 자료가 산술 평균을 중심으로 흩어져 있는 정도를 의미한다.
- 평균(mean): 변수의 모든 값을 더해서 값의 개수로 나누며, 관측값의 중심이 되는 값을 의미한다.
- 중앙값(median): 관측값을 크기순으로 배열하였을 경우 중앙에 위치한 값이다. 이상값에 덜 민감하다.
- 분산(variance): 각 관측값이 평균에서 얼마나 퍼져 있는지를 보는 정도이다. 각 관측값과 평균의 차이를 제곱한 후 평균을 구한 값이다.
- 표준편차(standard deviation): 표준화된 분산이다.
- 공분산(covariance): 두 변수의 관계를 알기 위해 공분산을 사용한다. 공분산은 X, Y가 각 평균으로부터 떨어진 거리, 즉 변수와 변수 평균값의 차이를 각 곱한 다음 평균으로 구한 값이다.
- 상관관계(correlation): 두 변수의 공분산을 각 변수의 편차로 나눠서 -1~1 사이로 조정한 값이다.