더북(TheBook)

5. 정규분포

통계의 대표적인 데이터 분포인 정규분포(normal distribution)를 알아보겠습니다. 정규분포란 데이터들이 평균값을 중심으로 하여 좌우 대칭의 종 모양을 이루는 분포를 의미합니다.

 

먼저 평균 66kg을 중심으로 표준편차 5를 갖는 몸무게 데이터 10만 개를 랜덤으로 만들어 보겠습니다.

weight <- rnorm(n = 100000, mean = 66, sd = 5) # 평균 66kg, 표준편차 5의 데이터 생성

* 랜덤으로 데이터를 생성하는 함수

 

만들어진 데이터를 히스토그램으로 그려 보겠습니다.

hist(weight, breaks = 100, freq = FALSE) # 히스토그램 그리기

* 구간을 100으로 쪼갭니다.

* 상대 값(밀도)으로 그립니다.

 

그림 2 | 몸무게 히스토그램

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.