더북(TheBook)

4.1 기초 통계 개념: 모집단/표본, 모수/통계량

통계는 분석의 대상이 되는 집단에 대하여 실시한 조사 및 실험의 결과로 얻어진 관측값을 의미하고 더 구체적으로는 그 관측값의 요약된 형태를 의미한다. 즉, 주어진 관측값을 요약한 값이라고 이해할 수 있다. 그리고 이러한 통계를 다루는 학문인 통계학1은 특정한 의도나 목적으로 조사, 연구할 때 자료 수집 방법과 수집한 자료를 과학적이고 논리적인 이론으로 정리/분석하는 역할을 한다. 이때 분석 대상에 관련된 자료를 수집/요약/정리/해석하며, 불확실한 사실에 대한 결론을 도출하는 데 필요한 이론과 방법을 제시한다.

그렇기에 통계와는 멀어보이는 머신 러닝, 딥러닝을 사용한다 하더라도 데이터를 기반으로 하는 모든 분석 활동에 앞서, 통계를 통해 데이터를 이해하는 것은 필수적이다. 무엇보다도 통계학은 데이터를 효율적으로 이해할 수 있게 도와준다.

예를 들어 살펴보자. 그림 4-1을 보면 여러 명의 어린이가 있는데, 그중에서 한 어린이만 주변 친구들에 비해 키가 상당히 큰 것을 볼 수 있다. 이 어린이의 부모는 자녀의 키가 다른 친구들의 키보다 실제로 큰 것인지, 아니면 주변 친구들의 키가 유난히 작은지를 알고 싶다고 하자.

▲ 그림 4-1 어린이들의 키 비교

 

 


1 통계학은 원래 국가산술(國家算術, state arithmetics)을 의미하고 세금을 거두기 위해 실시한 인구조사, 지가(地價) 산출로부터 시작되었다. 영국의 존 싱클레어(John Sinclair) 경에 의해 1791년에서 1799년 사이에 발간된 책자에 최초로 사용되었다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.