더북(TheBook)

regsubsets( )가 반환한 객체를 summary( )에 넘겨주면 BIC9 , 수정 결정 계수Adjusted R squared 등의 값을 쉽게 얻을 수 있다.10

> summary(m)$bic
[1] -385.0521 -496.2582 -549.4767 -561.9884 -585.6823 -592.9553
[7] -598.2295 -600.1663

> summary(m)$adjr2
[1] 0.5432418 0.6371245 0.6767036 0.6878351 0.7051702 0.7123567
[7] 0.7182560 0.7222072

plot( )을 사용해 다음과 같이 수정 결정 계수를 그려보면 각 변수가 선택되었을 때의 수정 결정 계수를 좀 더 쉽게 알 수 있다. 예를 들어, 그림의 가장 하단을 보면 절편과 lstat이 선택된 경우에는 수정 결정 계수 값이 0.54였으며, 가장 하단에서 두 번째 행을 보면 절편, rm, lstat이 선택된 경우 수정 결정 계수 값이 0.64였음을 알 수 있다. 수정 결정 계수가 가장 큰 모델은 절편, zn, chas1, nox, rm, dis, ptratio, b, lstat을 포함한 모델로 이때 수정 결정 계수는 0.72였다.

> plot(m, scale="adjr2")
그림 8-10 regsubsets( ) 결과로부터 구한 수정 결정 계수
그림 8-10 regsubsets( ) 결과로부터 구한 수정 결정 계수

마찬가지로 BIC를 기준으로 모델을 살펴보자.

> plot(m, scale="bic")
그림 8-11 regsubets( ) 결과로부터 구한 BIC
그림 8-11 regsubets( ) 결과로부터 구한 BIC

BIC가 가장 좋은 모델(작을수록 좋은 모델이다)은 절편, zn, chas1, nox, rm, dis, ptratio, b, lstat을 포함한 모델로 이때 BIC 값은 -600이었다.


9 베이지안 정보 기준(BIC, Bayesian Information Criteria)은 AIC와 마찬가지로 여러 모델이 주어졌을 때 최적의 모델을 선택하는 기준이다.

10 summary( )가 regsubsets( ) 결과에 대해 반환하는 결과는 ?summary.regsubsets에서 ‘Value’ 섹션을 확인하기 바란다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.