더북(TheBook)

앞 그래프에서는 점들이 균등하게 분배되지 않고 평균값 부근에 집중된 것을 분명히 볼 수 있다. 알려진 대로 통계 분포는 특정 수식으로 표현한다. 이론적인 수식에 접근하려고 R은 내장된 랜덤 분포에 대한 함수들을 제공한다. 더 구체적으로 균등 분포의 경우, R은 확률 밀도 함수 dunif(), 누적 밀도 함수 punif(), 사분위수 함수 qunif(), 난수 생성 함수 runif()를 제공한다. 균등 분포 관련 함수들과 대응되는 정규 분포 관련 함수는 dnorm(), pnorm(), qnorm()이다. 확률 밀도 함수, 누적 밀도 함수, 사분위수 함수, 난수 생성 함수 같은 이름은 R이 지원하는 다른 분포에도 동일하게 적용된다.

이렇게 가장 일반적으로 사용되는 통계 분포 이외에도 R은 이항 분포 등 이산 분포나 지수 분포 등 연속 분포에 대한 함수도 제공한다. R에서 ?Distributions를 실행하면 지원되는 통계 분포와 관련한 전체 함수 목록을 볼 수 있다. 책에서는 이러한 분포 함수를 모두 다루지 않는다. 분포 함수에 관심이 있다면 확률 이론 교과서를 읽어도 좋고, 위키피디아(https://en.wikipedia.org/wiki/Probability_distribution)에서 자세한 내용을 참고해도 좋다.

R은 다양한 분포를 지원하며 각 분포에 해당하는 함수가 있다. 다행히 비슷한 방식으로 함수에 이름을 붙이므로 많은 이름을 따로 기억할 필요는 없다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.