5. 정규분포
통계의 대표적인 데이터 분포인 정규분포(normal distribution)를 알아보겠습니다. 정규분포란 데이터들이 평균값을 중심으로 하여 좌우 대칭의 종 모양을 이루는 분포를 의미합니다.
먼저 평균 66kg을 중심으로 표준편차 5를 갖는 몸무게 데이터 10만 개를 랜덤으로 만들어 보겠습니다.
weight <- rnorm(n = 100000, mean = 66, sd = 5) # 평균 66kg, 표준편차 5의 데이터 생성
* 랜덤으로 데이터를 생성하는 함수
만들어진 데이터를 히스토그램으로 그려 보겠습니다.
hist(weight, breaks = 100, freq = FALSE) # 히스토그램 그리기
* 구간을 100으로 쪼갭니다.
* 상대 값(밀도)으로 그립니다.
그림 2 | 몸무게 히스토그램