그래프를 살펴보면 평균인 66kg을 중심으로 데이터가 몰려 있고, 평균에서 멀어질수록 데이터가 줄어드는 것을 알 수 있습니다. 즉, 50kg인 데이터도 있고 80kg인 데이터도 있지만, 평균 66kg을 중심으로 표준편차는 5의 분포이기에 66kg 주위에 데이터가 가장 많고 멀어질수록 데이터가 줄어드는 형태라는 것을 알 수 있습니다. 마치 가운데는 볼록하게 솟아 있고 양쪽은 아래로 떨어지는 종 모양처럼 생긴 분포입니다. 이를 정규분포라고 합니다. 정규분포는 예시로 든 몸무게뿐만 아니라 신장, 성적, 주가 수익률 등 일상에서 다양하게 적용할 수 있습니다.
데이터 분포를 좀 더 자세히 확인하고자 몸무게의 밀도 값을 선 그래프로 그려 보겠습니다.
lines(density(weight))
* 몸무게의 밀도를 선 그래프로 그립니다.
그림 3 | 몸무게 정규분포 곡선