더북(TheBook)
# 같은 자료에서 그룹별로 group1, group2, group3 값에 대해서 일원 분산분석하기
>>> stats.f_oneway(group1, group2, group3)
F_onewayResult(statistic=3.7113359882669763, pvalue=0.043589334959178244)

4. 각 그룹쌍에 대해서 t 검정하기

>>> print(stats.ttest_ind(group1, group2))
Ttest_indResult(statistic=2.5581789927784295, pvalue=0.02184081286794004)

>>> print(stats.ttest_ind(group1, group3))
Ttest_indResult(statistic=1.326611291434599, pvalue=0.21151930405600672)

>>> print(stats.ttest_ind(group2, group3))
Ttest_indResult(statistic=-1.0724508202985763, pvalue=0.30461196197608215)

5. 위의 자료에서 그룹 1과 2의 평균값에 대해 다중 비교하기

>>> from statsmodels.stats.multicomp import pairwise_tukeyhsd
>>> tukey = pairwise_tukeyhsd(endog=data[:, 0],   # 데이터
>>>     groups=data[:, 1],   # 그룹
>>>     alpha=0.05)          # 유의 수준
>>> tukey.summary()   # 다중 비교의 결과를 아래에서 확인. group1과 group2에서 귀무 가설이 기각되는 것을 볼 수 있음
Multiple  Comparison of Means - Tukey HSD,FWER=0.05
group1     group2   meandiff       lower     upper   reject
   1.0        2.0   -60.1806   -116.6056   -3.7555     True
   1.0        3.0    -38.625   -104.8246   27.5746    False
   2.0        3.0    21.5556    -43.2141   86.3252    False
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.