더북(TheBook)

그렇다면 왜 확률변수와 확률함수는 통계에서 필요할까요? 확률함수는 확률변수가 일어날 확률을 나타내는 함수이므로 특정 확률변수의 확률함수를 알고 있다면 특정 사건이 일어날 확률을 예측할 수 있습니다.

 

파이썬의 SciPy 라이브러리에서 제공하는 stats 서브패키지는 확률분포를 분석할 수 있는 다양한 기능을 제공합니다.

 

In [9]:

# stats 서브패키지를 호출합니다
# 한글 깨짐을 방지하는 코드
import matplotlib as mpl
import matplotlib.pylab as plt
from matplotlib import font_manager

font_fname = 'C:/Windows/Fonts/malgun.ttf'
font_family = font_manager.FontProperties(fname=font_fname).get_name()

plt.rcParams["font.family"] = font_family

 

In [10]:

from scipy import sp
import seaborn as sns
import numpy as np
import matplotlib as mpl
import matplotlib.pylab as plt
%matplotlib inline

# 확률질량함수는 SciPy의 stats 서브패키지에 binom 클래스로 구현합니다
N = 10 # 전체 시도 횟수
mu = 0.6 # 베르누이 확률분포의 기댓값
rv = sp.stats.binom(N, mu)
xx = np.arange(N + 1)

# 그래프를 표현할 때는 matplotlib을 사용합니다
plt.bar(xx, rv.pmf(xx), align="center") # 확률질량함수 기능을 갖는 pmf를 사용합니다
plt.xlabel("표본값")
plt.ylabel("$P(x)$")
plt.title("확률질량함수 pmf")
plt.show()

 

그림 15-5 | 확률밀도함수

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.