더북(TheBook)

5.10 핵심 요약

1. 확률

  • 확률이란 불확실한 사건이 발생할 정도를 수량화한 것으로, 0~1 사이의 값으로 나타낸다.
  • 확률 변수: 측정치로부터 얻을 수 있는 값의 총 집합을 표본 공간이라 하는데, 표본 공간의 각 값에 실수를 부여하는 함수이다.
  • 확률 분포: 확률 변수가 취할 수 있는 모든 값에 대해 이들 값들이 취할 수 있는 확률을 그림이나 표, 함수식으로 나타낸 것이다.

2. 가설 검정 단계

  • 1 단계: 가설을 설정한다. 귀무 가설(H0)과 대립 가설(H1)을 세운다.
  • 2 단계: 검정 통계량(test statistics) 산출 또는 유의 수준(α)을 결정한다.
  • 3 단계: 기각치(critical value) 또는 p값을 산출한다.
  • 4 단계: 귀무 가설의 기각 여부를 결정한다. p값이 유의 수준보다 작으면 귀무 가설을 기각한다.
  • 5 단계: 해석한다.

3. 가설 검정 관련 용어

  • 가설 검정: 표본(sample)으로부터 주어지는 정보를 이용하여 모수에 대한 주장 또는 추측 등의 옳고 그름을 확률적인 개념을 이용하여 판정하는 과정이다.
  • 귀무 가설(null hypothesis): 과거부터 알려져 왔던 모수에 대한 일반적인 내용을 나타내며 H0으로 표현한다.
  • 대립 가설(alternative hypothesis): 자료로부터 얻은 증거에 의하여 입증하려는 내용으로 귀무 가설과 대립된다. H1 또는 Ha로 표현한다.
  • 유의 수준(significance level): 통계적 가설 검정에서 사용되는 기준값으로, α로 표현한다.
  • p: 가설 검정에서 검정 통계량이 나타날 확률로, 이 값을 유의 수준과 비교하여 귀무 가설을 기각하는데 사용할 수 있다. p값은 유의 확률(significance probability)이라고도 하며, 이 값이 유의 수준보다 작으면 귀무 가설을 기각할 수 있다.
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.